科羅拉多大學博爾德分校數據科學理學碩士學位統計推斷課程介紹

萬物雲聯網 發佈 2022-11-30T07:59:53.191859+00:00

通過攻讀科羅拉多大學博爾德分校的完整數據科學理學碩士學位,學習寶貴的數據科學職業技能。該碩士學位課程利用了統計學、數據科學、計算機科學、自然語言處理、信息科學等領域無與倫比的教師專業知識。您將獲得廣泛適用的基礎技能,並發展適合特定職業道路的專業能力。

通過攻讀科羅拉多大學博爾德分校的完整數據科學理學碩士學位,學習寶貴的數據科學職業技能。

該碩士學位課程利用了統計學、數據科學、計算機科學、自然語言處理、信息科學等領域無與倫比的教師專業知識。您將獲得廣泛適用的基礎技能,並發展適合特定職業道路的專業能力。數據科學家目前被 Glassdoor 和 Quanthub 評為美國排名第三的職位,數據科學理學碩士 畢業生將準備好利用對熟練數據人才的高需求來找到新工作或提升你的職業生涯。

數據科學基礎:統計推斷(Data Science Foundations: Statistical Inference)課程介紹

統計推斷(Statistical Inference)是數據科學家用來從數據樣本中得出更大結論的一種方法,是任何想在數據科學領域取得成功的人的必備技能。在本課程中,您將了解探索性數據分析、概率論、統計推斷和數據建模,並涵蓋離散和連續概率分布、期望、大數定律、中心極限定理、統計參數等關鍵主題估計、假設檢驗和回歸分析。本課程將特別關注 R 程式語言中的應用程式。

數據科學基礎:統計推斷課程的參考學習書籍

《R中數據科學的回歸模型:數據科學的統計推斷(Regression Models for Data Science in R: Statistical inference for data science)》

本書的特別之處:本書的理想讀者將是定量素養,並對統計概念和R編程有基本的了解。學生應該對統計推斷有基本的了解,如「數據科學的統計推斷」中所包含的。本書從實踐的角度對回歸模型的基本概念進行了嚴格的處理。閱讀本書並觀看相關視頻後,學生將能夠執行多變量回歸模型並理解它們的解釋。

《上下文中的統計假設檢驗:可重複性、推理和科學(Statistical Hypothesis Testing in Context: Reproducibility, Inference, and Science)》

Fay和Brittain提出了統計假設檢驗和兼容置信區間,重點是應用和正確的解釋。重點是為應用統計學家提供足夠的工具——以及在其中選擇的建議——為幾乎任何問題找到合理的方法,並通過修改現有方法找到足夠的理論來解決新問題。在涵蓋了基本的數學理論和科學原理之後,針對特定類型的數據開發了測試和置信區間。涵蓋了應用程式的基本方法,例如創建測試的一般程序(例如,似然比,自舉,排列,模型測試),多重測試的調整,聚類,分層,因果關係,刪失,缺失數據,組順序測試和非劣效性測試。作者開發的新方法貫穿始終,例如用於比較兩個樣本的融合置信區間以及與Wilcoxon-Mann-Whitney檢驗和Kaplan-Meier估計相關的置信區間。本書包括支持實際使用的示例、練習和 R 軟體包。

《統計推理基礎:隨機誤差的含義是什麼?(Fundamentals of Statistical Inference: What is the Meaning of Random Error?)》

本書對有關統計推斷的基本問題進行了連貫的描述,並展示了統計學如何幫助我們僅基於有限的數據集(例如從較大人群中抽取的隨機樣本)對更廣泛的背景進行歸納推斷。通過將這些基礎知識與與p值和統計顯著性檢驗相關的推理錯誤的方法論辯論聯繫起來,讀者可以清楚地掌握統計推斷的前提,以及它可以做什麼和不能做什麼。為了便於直覺,整本書的表述儘可能非技術性。


本書背後的核心靈感來自關於良好統計實踐和複製危機的科學辯論。對統計改革的呼籲包括2016年美國統計協會前所未有的方法論警告,2019年《美國統計學家》特刊「21世紀的統計推斷:超越p<0.05的世界」,以及2019年廣泛支持的呼籲「退休統計意義」。


該書闡明了基於樣本的推理的概率基礎和潛力,包括隨機數據生成、效應大小估計和隨機誤差引起的估計不確定性評估。基於對這些基礎知識的透徹理解,它描述了p值概念和零假設顯著性檢驗儀式,最後指出了隨之而來的推理錯誤。這使讀者有能力避免將來出現誤導性的統計例行程序和對統計量的誤解。

本書面向有興趣了解統計推斷作用的讀者,在考慮隨機誤差引起的不確定性的情況下,對從特定數據集中獲得的知識收益進行了審慎的評估。更具體地說,它為研究生以及具有統計學基礎知識的統計從業人員提供了可訪問的資源。最後但並非最不重要的是,本書針對的是對上述改革辯論具有真正方法論感興趣的科學家。

《統計建模與推理簡介(Introduction to Statistical Modelling and Inference)》

大規模數據集(「大數據」)的複雜性刺激了用於分析它們的先進計算方法的發展。有兩種不同的方法可以幫助做到這一點。基於模型的方法使用概率模型和似然以及貝葉斯理論,而無模型方法不需要概率模型、似然或貝葉斯理論。這兩種方法基於概率論的不同哲學原理,由著名統計學家羅納德·費舍爾和耶日·內曼提出。
《統計建模和推理簡介》涵蓋簡單的實驗和調查設計,以及概率模型,包括廣義線性(回歸)模型及其一些擴展,包括有限混合物。本書還討論和分析了來自不同應用領域的各種示例。除了廣義線性模型的最大似然分析所需的軟體外,沒有使用任何特殊軟體。學生應具有代數,坐標幾何和微積分的基本數學背景。

本書的主要特徵

  • 概率模型是從樣本經驗累積分布函數(cdf)的形狀或其變換中開發的。
  • 總體累積分布函數值的邊界是從經驗 cdf 的每個點的 Beta 分布中獲得的。
  • 貝葉斯定理是從罕見病症篩選測試的性質發展而來的。
  • 多項分布為任何隨機採樣數據提供了始終為真的模型。
  • 用於查找樣本估計精度的無模型自舉方法具有基於模型的平行 - 貝葉斯自舉 - 基於始終為真的多項式分布。
  • 模型參數的貝葉斯後驗分布可以從模型的最大似然分析中獲得。

本書面向包括數據科學在內的廣泛學科的學生。本書基於基於模型的理論,該理論被許多領域的科學家廣泛使用,並將其與計算機科學,機器學習和官方調查分析中流行的無模型理論進行了比較,但不太詳細。貝葉斯分析的最新發展加速了基於模型的理論的發展。

《統計推斷和概率(Statistical Inference and Probability)》

John Macinnes是數據分析和統計領域經驗豐富的作者,他撰寫了這一本簡潔易懂的書籍,用通俗易懂的語言和詳細的示例分解了推論統計的複雜主題。本書涵蓋了一系列主題,包括:

  • 概率和抽樣分布
  • ​推理和回歸
  • ​功效、效應大小和反概率

作為SAGE定量研究工具包的一部分,本書將為您提供在定量研究之旅中取得成功所需的專業知識和信心。

關鍵字: