SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 卡方檢驗(yàn)是一種常用的非參數(shù)檢驗(yàn)方法,其統(tǒng)計(jì)的是樣本的實(shí)際觀測(cè)值與理論推斷值之間的偏離程度,卡方值越大,二者偏差程度越大;反之,二者偏差程度越小,可用于檢驗(yàn)數(shù)值是否符合分布規(guī)律、檢驗(yàn)因素的影響是否有差異等。
IBM SPSS Statistics非參數(shù)檢驗(yàn)中的卡方檢驗(yàn),比較的是變量中的實(shí)際觀測(cè)頻率和期望的頻率的差異。本文將以檢驗(yàn)數(shù)值是否符合均勻分布為例,演示IBM SPSS Statistics卡方檢驗(yàn)方法的使用。
一、打開(kāi)數(shù)據(jù)文件
如圖1所示,打開(kāi)一組擲骰子的數(shù)據(jù),其中包含了擲骰子次數(shù)、點(diǎn)數(shù)兩個(gè)變量。擲骰子的結(jié)果數(shù)據(jù)是一個(gè)典型的均勻分布數(shù)據(jù),骰子出現(xiàn)1-6點(diǎn)數(shù)的概率是相等的。

圖1:擲骰子數(shù)據(jù)
二、應(yīng)用卡方檢驗(yàn)
接著,如圖2所示,打開(kāi)IBM SPSS Statistics的分析菜單,并選擇其非參數(shù)檢驗(yàn)中的“卡方檢驗(yàn)”。

圖2:非參數(shù)檢驗(yàn)之卡方檢驗(yàn)
如圖3所示,設(shè)置面板中包含了檢驗(yàn)變量列表、期望范圍、期望值等選項(xiàng)。接下來(lái),使用示例數(shù)據(jù)演示卡方檢驗(yàn)的操作。

圖3:卡方檢驗(yàn)設(shè)置面板
1、選擇變量
我們先簡(jiǎn)單了解一下卡方檢驗(yàn)中的選項(xiàng)含義:
1. 檢驗(yàn)變量列表,即用于檢驗(yàn)的變量。
2. 期望范圍,用于設(shè)置卡方檢驗(yàn)的數(shù)據(jù)范圍,默認(rèn)選擇“從數(shù)據(jù)中獲取”,即使用數(shù)據(jù)中的最大值和最小值作為期望范圍;如需“使用指定范圍”,需手動(dòng)設(shè)置范圍。
3. 期望值,用于設(shè)置數(shù)據(jù)中各分類所占的比例,默認(rèn)選擇“所有類別相等”,即檢驗(yàn)數(shù)據(jù)是否服從均勻分布;選擇“值”,則檢驗(yàn)數(shù)據(jù)是否服從設(shè)定的分布規(guī)律,需輸入指定分組的值。
本例中,我們需要檢驗(yàn)的是擲骰子的結(jié)果是否服從均勻分布,因此,需將“點(diǎn)數(shù)”添加為檢驗(yàn)變量列表,并設(shè)置“從數(shù)據(jù)中獲取”的期望范圍,以及“所有類別相等”的期望值。

圖4:變量設(shè)置
2、設(shè)置精確檢驗(yàn)
由于卡方檢驗(yàn)屬于非參數(shù)檢驗(yàn),需要進(jìn)行精確檢驗(yàn)設(shè)置。一般情況下,選擇“僅漸進(jìn)法(適用于較大樣本或服從漸進(jìn)分布的數(shù)據(jù))”,如果數(shù)據(jù)不符合漸進(jìn)分布,則要選擇蒙特卡洛法。

圖5:設(shè)置精確檢驗(yàn)
3、設(shè)置選項(xiàng)
接著,進(jìn)行選項(xiàng)設(shè)置,如圖6所示,選取描述統(tǒng)計(jì),獲取數(shù)據(jù)的頻率分析數(shù)值,幫助解讀數(shù)據(jù)結(jié)果。

圖6:設(shè)置選項(xiàng)
4、分析結(jié)果解讀
完成以上設(shè)置后,運(yùn)行卡方檢驗(yàn)。
首先,如圖7所示,從頻率表可以看到,各個(gè)點(diǎn)數(shù)的出現(xiàn)概率幾乎相同,其期望個(gè)案值為16.7。
接著,分析檢驗(yàn)統(tǒng)計(jì)數(shù)據(jù),其漸近顯著性為1,表明檢驗(yàn)結(jié)果不顯著,不能拒絕假設(shè)。由于本例檢驗(yàn)所用的原假設(shè)是數(shù)據(jù)的分布與均勻分布無(wú)差異,檢驗(yàn)結(jié)果不顯著,無(wú)法拒絕原假設(shè),也就是數(shù)據(jù)服從均勻分布。

圖7:結(jié)果不顯著
綜上所述,通過(guò)運(yùn)用IBM SPSS Statistics的卡方檢驗(yàn),并設(shè)定的所有類別相等的期望,可檢驗(yàn)數(shù)據(jù)是否服從均勻分布。
另外,卡方檢驗(yàn)除了可用于檢驗(yàn)均勻分布外,還可以通過(guò)設(shè)定交叉表進(jìn)行列聯(lián)表分析,來(lái)探索變量間的相關(guān)關(guān)系。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |