雙因素方差分析全流程總結

spssau 發佈 2024-04-28T10:34:14.888602+00:00

上篇文章講述了「單因素方差分析全流程總結」,單因素方差分析只是考慮了一個自變量(定類)與一個因變量(定量)之間的關係,但是在實際問題研究中可能研究兩個或者幾個因素與因變量之間的關係,例如,分析產品滿意度與學歷、品牌滿意度等的關係。

上篇文章講述了「單因素方差分析全流程總結」,單因素方差分析只是考慮了一個自變量(定類)與一個因變量(定量)之間的關係,但是在實際問題研究中可能研究兩個或者幾個因素與因變量之間的關係,例如,分析產品滿意度與學歷、品牌滿意度等的關係。當方差分析中研究幾個自變量和1個因變量之間的關係時,稱為多因素方差分析。如果是兩個自變量則為雙因素方差分析。

一、案例與數據

有四個品牌的吸塵器在兩個地區的不同門店銷售,為分析吸塵器的品牌和銷售地區對銷售量的影響,搜集每個品牌在各地區的銷售數據,銷售經理根據搜集的數據想要進行分析品牌和地區對吸塵器的銷售量是否有顯著差異以及兩個因素搭配是否對銷售量產生新的影響,部分數據如下:

二、分析問題

例子中涉及三個變量,一個是「地區」一個是「品牌」還有一個是「銷售量」。其中「地區」和「品牌」是定類變量,「銷售量」是定量變量,想要進行分析品牌和地區對吸塵器的銷售量是否有顯著差異,分析究竟是一個因素在起作用,還是兩個因素都在起作用,還是兩個因素都不起作用。這就是一個雙因素方差分析問題。

三、分析前準備

在進行雙因素方差分析前需要進行分析前準備,首先進行數據的異常值檢查,然後驗證數據是否滿足雙因素方差分析的要求:

案例已經滿足前兩個條件,只需驗證在個總體中,每個總體服從正態分布和方差齊性。

1、異常值檢驗

異常值是指在數據中不正常的值,也稱離群值,比如大於三倍標準差等。與其它方差分析一致,雙因素方差分析對異常值也比較敏感,這些數據可能會導致分析結果異常,比如扭曲各分類之間的差異,所以檢驗異常值尤為重要。利用SPSSAU箱線圖進行查看直觀且容易查看異常值點。

不同地區的銷量:

從箱線圖中可以看出不同地區吸塵器的銷量沒有發現異常值。

不同品牌的銷量:

從箱線圖中可以看出不同品牌吸塵器的銷量沒有發現異常值。綜上:數據中暫未發現異常值,不需要處理。

那麼如果出現異常值如何處理呢?

常見做法是將異常值剔除,重新進行分析,有時異常值數量較多,不希望剔除,那麼也可以處理為缺失值進行填補(一般平均值和中位數等使用較多),或者利用插值法進行插值。接下來進行檢查數據是否符合方差分析的前提條件,首先進行正態性檢驗。

2、正態性檢驗

檢驗數據是否服從正態分布有很多種方式其中包括正態性檢驗以及圖示化P-P圖或者Q-Q圖等,例子中要檢驗每個總體是否服從正態分布,由於正態性檢驗最為嚴謹,所以這裡使用正態性檢驗進行分析。不同品牌的銷量結果如下:

SPSSAU共提供三種正態性檢驗其中包括K-S檢驗(Kolmogorov-Smirnov檢驗)、S-W檢驗(Shapiro-Wilk檢驗)以及J-B檢驗(Jarque-Bera檢驗),由於每個個體的樣本為6個總樣本量為24個小於50所以為小樣本分析,使用S-W檢驗進行分析即可,如果樣本量較大(比如大於50)可以考慮使用K-S或者J-B檢驗。發現S-W檢驗中p值均大於0.05,所以不同地區的銷量滿足正態性檢驗,不同地區吸塵器的銷量分析也是如此:

綜上,每個總體服從正態分布,接下來驗證是否服從方差齊性。

3、方差齊檢驗

方差齊性指自變量X的取值範圍內,不論X取什麼值,對應的Y為服從正態分布的隨機變量,並具有相同的方差,即Y的方差與X值的大小無關(來源百度百科)。利用SPSSAU進行方差齊檢驗(分析路徑【通用方法】→【方差】)。不同地區的銷量方差齊分析如下:

利用方差齊性檢驗各組別數據的波動情況,從方差齊分析結果中可以看出結果的F值為0.043,p值為0.838大於0.05,說明不同地區的銷量沒有顯著差異性,也即說明具有方差齊性,同理可以分析不同品牌的銷量也具有方差齊性(不進行贅述)。

綜上,每個總體服從方差齊性,並且滿足雙因素方差分析的前提條件,所以接下來進行雙因素方差分析。

四、雙因素方差分析

為了研究品牌和地區對吸塵器的銷售量是否有顯著差異以及兩個因素搭配是否對銷售量產生新的影響,以品牌和地區作為自變量,以銷售量作為因變量進行雙因素方差分析。

1、主效應

考慮某因素的主效應時,需要考慮除所有因素的效應,簡單來說就是X對Y的影響。比如:雙因素方差分析中,分別去判斷「地區」和「品牌」對銷售量的影響。

結果如下:

首先進行查看變量「地區」,發現自變量地區的F值為21.970,並且p值小於0.05所以說明主效應存在,然後對「品牌」進行分析,發現品牌的F值為130.145並且p值小於0.05所以說明主效應存在,具體差異可以進行事後多重比較進行分析。接下來研究「地區」和「品牌」搭配是否對銷售量產生新的影響,進行查看交互效應。

2、交互效應

在雙因素方差分析中,如果除了研究品牌和地區對銷售量的影響還研究兩個因素搭配是否對銷售量產生新的影響,例如例子中的某個地區對某種品牌吸塵器有特殊偏好,則為雙因素方差分析的交互作用分析,即交互效應。

從上表可以看出,分析項為「地區與品牌的交互項」因變量為「銷售量」發現模型的F值為1.649,並且p值為0.218大於0.05,所以模型不顯著,即說明沒有交互效應。分析完畢。綜上,存在主效應但不存在交互效應,接下來進一步分析。

五、進一步分析

如果進行雙因素方差分析,一般是主效應顯著後才會進一步查看事後多重比較,對於交互作用顯著的模型才會更深一步研究簡單效應分析。

1、簡單效應

簡單效應是指簡單效應指X1在某個水平時,X2不同水平的比較;因為該模型只存在主效應所以進行事後多重比較不進行簡單效應分析。如果存在交互效應,則可以進一步分析簡單效應。

2、事後多重比較

因為主效應顯著,並且「地區」和「品牌」兩個主效應都顯著,所以進行事後多重比較,進一步分析(此處利用LSD方法進行,因為該方法對差異最為敏感使用最為廣泛,並且檢驗效能高,對比組別較少時使用,除此之外SPSSAU還提供其它方法,比如:Bonferroni校正等)。

「地區」事後多重比較:

比較不同地區的銷量是否有顯著性差異,上表可以看出t值為-4.687,p值遠小於0.05所以地區1和地區2的銷量有顯著性差異並且地區1與地區2的均值差值為負數,說明地區2的均值更大,從側面說明地區2的銷量更好。

「品牌」事後多重比較:

比較不同品牌的銷量是否有顯著性差異,上表可以看出品牌1、品牌2、品牌3、品牌4兩兩之間比較,p值均遠小於0.05所以不同品牌兩兩之間的銷量均有顯著性差異,並且從均值差值中可以看出品牌1的均值更大,從側面說明品牌1的銷量更好。

六、總結

通過雙因素方差分析研究了「品牌和地區對吸塵器的銷售量是否有顯著差異以及兩個因素搭配是否對銷售量產生新的影響」,最後發現品牌和地區對吸塵器的銷售量有顯著性差異,但是兩個因素搭配並未對對銷售量產生新的影響,並且利用事後多重比較進一步分析發現不同地區對銷售量有顯著性差異,並且地區2銷量更好,不同品牌兩兩之間的銷量均有顯著性差異品牌1的銷量更好,所以公司在做決策時可以重點分析地區2和品牌1的特點或者策略等。

關鍵字: