前面我們提過了卡方獨立性檢定和同質性檢定的用法,接下來我們來說明卡方適合度檢定( Test of Goodness-of-Fit ),適合度檢定用於分析兩分布的比例是否一致,其說明如下。
一、使用狀況:
欲了解某一變項是否與理論或者是與母體分配相符合。適用於單一類別變項之隨機樣本對已知預期值之檢定。例如:想要知道本次抽血血型的分佈比例是否符合台灣人血型的分布,進行母體與樣本的比較。
血型 | A | B | AB | O |
母體分布 | 25% | 25% | 30% | 20% |
樣本分布 | 20% | 30% | 30% | 20% |
前提假設:
1. 變項為類別變項(categorical variable)
2. 每一檢定細格(cell)內的數據應該設為頻率或計數數目,而不是百分比或是經過轉換之數據。
3. 至少有80%以上的細格,其數據至少大於5。樣本數目至少要為細格數目的五倍。
二、假說檢定(Hypothesis Testing):
卡方值之計算公式:
以上述血型為例子:假設此次抽血樣本數有100個
血型 | A | B | AB | O |
母體分布 | 25% | 25% | 30% | 20% |
樣本分布 | 20(個數) | 30 | 30 | 20 |
根據上面公式我們可以計算:
假設顯著水準α訂為5%,自由度為3,查卡方分配表臨界值是7.82,卡方值2未達顯著,所以接受虛無假設,故樣本分布與母體分布是相同的。
三、SPSS 操作Example:
我們就以上面血型的例子來進行操作。
1. 在SPSS中輸入欲分析之資料。
2. 資料型態如下:
3. 使用加權次數,點選資料→加權觀察值
點選觀察值加權依據:個數
4. 卡方性適合度檢定:分析→無母數檢定→歷史對話紀錄→卡方
點選血型:在按照順序打入期望值數值
四、檢定結果:
統計報表指出,本次分析卡方值為2,p值為0.572,接受虛無假設,與前面直接用公式計算的結果一致,認為母體跟樣本的分布一樣。
以上教學分析檔可從下列網址下載,僅供同學練習使用。