「SPSSAU|數據分析」:單因素方差分析步驟匯總

spssau 發佈 2022-05-22T22:28:30.090621+00:00

方差分析是20世紀20年代發展起來的一種統計方法,它是由英國統計學家費希爾在進行試驗設計時為解釋試驗數據而首先引入的。(來源:統計學 第7版)目前,方差分析廣泛應用於生物學、田間試驗等。

方差分析是20世紀20年代發展起來的一種統計方法,它是由英國統計學家費希爾在進行試驗設計時為解釋試驗數據而首先引入的。(來源:統計學 第7版)目前,方差分析廣泛應用於生物學、田間試驗等。從形式上看,方差分析是比較多個總體的均值是否相等,但本質上是研究變量之間的關係,本篇文章主要介紹單因素方差分析步驟。

一、前期準備

1.研究目的

方差分析(單因素方差分析),用於分析定類數據與定量數據之間的關係情況。例如研究人員想知道三組學生的智商平均值是否有顯著差異。方差分析可用於多組數據,比如本科以下,本科,本科以上共三組的差異;而下述t 檢驗僅可對比兩組數據的差異。

2.分析要求

分析的大致要求如下:

異常值:如果數據有異常值,比如本身數據全部應該大於0,但卻出現小於0的數字【可使用SPSSAU通用方法裡的頻數分析,或者描述分析等進行檢查】可以使用SPSSAU「數據處理」模塊下的異常值處理,右側分析框可以設置「判斷標準」

如有異常值,可以對異常值進行處理設為Null或者用平均值、中位數、眾數、隨機數等進行填補。

正態分布:方差分析理論上是要求數據服從正態分布的,但是理論上的正態分布很難滿足,數據接近於正態分布更符合實際情況,因此接近正態分布的數據直接使用方差分析即,也可以說方差分析對於正態性的要求是穩健的。

方差齊性:一般來講,方差輕微不齊僅會對方差分析的結論有少許影響。如果方差不齊可以使用其他分析方法,例如:Welch anova、Brown-Forsythe anova。

3.數據格式

方差分析是研究不同組別的差異,比如不同學歷時滿意度的差異。因此數據格式中一定需要有組別X(比如學歷)和分析項Y(比如滿意度)。

有時候只有分析項(比如3個分析項),但是現在希望此3個分析項的差異,那麼就需要對數據進行改造,自己加入一列『組別』,然後把數據重疊起來得到分析項Y,類似如下圖:

二、SPSSAU操作

1.上傳數據

登錄帳號後進入SPSSAU頁面,點擊右上角「上傳數據」,將處理好的數據進行「點擊上傳文件」上傳即可。

2.拖拽分析項

在「通用方法」模塊中選擇「方差」方法,將X定類變量放於上方分析框內,Y定量變量放於下方分析框內,點擊「開始分析」即可。

3.選擇參數

方差分析方法中有以下4個方法供研究者選擇,分別是方差分析、方差齊檢驗、Welch anova、Brown-Forsythe anova。

方差分析:分析定類數據與定量數據之間的關係情況。(要求方差齊)

方差齊檢驗:用於分析不同定類數據組別,對定量數據時的波動情況是否一致。

Welch anova:採用Welch分布的統計量進行的各組均值是否相等的檢驗

Brown-Forsythe anova:採用Brown-Forsythe分布的統計量進行的各組均值是否相等的檢驗。

補充說明:如果數據不滿足方差齊性也可以使用Welch anova以及Brown-Forsythe anova。

三、SPSSAU分析

1.方差分析結果對比

案例背景:分析不同學歷之間的工作人員薪資是否有差異。其中1.0代表高中畢業,2.0代表專科,3.0代表本科學歷,4.0代表研究生學歷(數據只適用於此案例分析)。

學歷對於薪資呈現出0.05水平的顯著性(p=0.000<0.05)同時也可以使用折線圖進行直觀展示。

2.方差分析圖對比

上述折線圖展示的是學歷和薪資方差分析對比,從圖中可以看出不同學歷樣本對於薪資均有著差異性。

3.效應量指標

補充說明:除此之外SPSSAU還提供了方差分析中間過程值表以及方差分析結果的普通格式以及簡化縱向格式,如下:

(1)方差分析中間過程值:

(2)方差分析結果(普通格式)

(3)方差分析結果(簡化縱向格式)

四、其他說明

1.差異性分析

如果X和Y均為定類數據,想對比差異性,此時需要使用卡方分析。如果X為定類,Y為定量;且X分為兩組,比如男和女;此時也可使用t 檢驗進行差異對比(當然也可使用方差分析)。總結如下表:

2. 方差分析中間過程值,組間平方和、組內平方和、自由度、均方等問題?

方差分析用於研究差異,差異共由兩部分組成,分別是組間平方和,組內平方和;同時對應著自由度值等;計算分別如下:

  1. 組間自由度df 1=組別數量 – 1;
  2. 組內自由度df 2 = 樣本量 – 組別數量;
  3. 組間均方 = 組間平方和 / 組間自由度df 1;
  4. 組內均方 = 組內平方和 / 組內自由度df 2;
  5. F 值 = 組間均方 / 組內均方;
  6. p 值是結合F 值,df 1和df 2計算得到。

五、總結

理論上講,方差分析前需要滿足方差齊,如果方差齊則使用方差分析,如果方差不齊則使用非參數檢驗。理論和實踐相比,永遠有gap,現實研究中,最常見的依然是方差分析(而不是非參數檢驗),原因在於非參數檢驗的檢驗效能相對於方差分析會低一些。在方差分析時SPSSAU會自動處理方差齊性問題。

關鍵字: