當進行數據分析時,理解以下統計學常見術語將有助於更好地解釋和解讀數據:
樣本:從總體中選出的一部分數據。
總體:研究對象的全部數據。
參數:總體的特徵數值,如總體均值、總體標準差等。
統計量:用於描述樣本特徵的數值,例如樣本均值、樣本標準差等。
P值:表示觀察到的數據或更極端情況在原假設為真的情況下出現的概率。當P值小於顯著性水平 (0.05或0.01),可以認為結果是顯著的
R2:衡量回歸模型擬合程度的統計指標,越接近1表示模型對觀測數據的擬合效果越好。
X2:卡方統計量的簡稱,用來表示卡方分布中的一個具體的觀測值,一般來說,卡方統計量越大,觀察到的數據與期望數據之間的差異越大。
VIF值:用於檢測自變量之間多重共線性程度,一般來說,VIF值大於10被認為存在較為嚴重的多重共線性。
F值:用於方差分析(ANOVA) 中,表示組間方差與組內方差的比值。通過與F分布的臨界值進行比較,以判斷組間差異是否顯著。
t值:用於檢驗參數的顯著性,特別是在學生t檢驗和回歸分析中使用。t值表示參數估計值與其標準誤差的比值,與t分布的臨界值進行比較以判斷參數的顯著性。
方差:各變量值與其平均數離差平方的平均數。
標準差:方差的平方根。數值越大,表示數據點與均值之間的差異程度越大,數據集的離散程度也越高
標準誤:標準差除以樣本量的平方根。表示估計值與真實值之間的平均偏差,用于衡量估計值的精確程度
自由度:表示在計算統計量時可以自由變動的觀測值數量
相關係數:衡量兩個變量之間相關關係的強度和方向。接近1表示正相關,接近-1表示負相關,0表示無線性相關。
顯著性水平:用於判斷統計推斷的可靠性,通常使用的顯著性水平是0.05或0.01。
顯著差異:指觀察到的差異在統計上是顯著的,即不太可能是由隨機因素引起的。
一致性: 隨著樣本量的增大,估計量的值越來越接近被估總體的參數。
假設檢驗:用於驗證關於總體參數的假設,包括零假設和備擇假設
F檢驗:判斷是否存在顯著的線性關係
原假設:假設沒有觀察到的效應、差異或關聯。通常將其表示為Ho。原假設是需要進行推翻或拒絕的假設。
備擇假設:與原假設相反。假設觀察到的效應、差異或關聯是存在的。備擇假設是用來支持或接受的假設。
置信度:對於估計值或統計結果的可信程度或精度的度量。
置信區間:由樣本統計量所構造的總體參數的估計區間。
95%置信度:表示對於估計值或統計結果的可信程度,有95%的把握認為真實值落在置信區間內。
交互作用:一個因素和另一個因素聯合產生的對因變量的附加效應。
擬合優度檢驗:對多個總體比例是否等於其期望概率的檢驗。當期望概率相同時,表現為對多個總體比例是否相等的檢驗。
轉載自公眾號 SPSSPRO