SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。 在使用IBM SPSS Statistics參數(shù)檢驗中的T檢驗時,一般情況下,都需先驗證數(shù)據(jù)是否服從正態(tài)分布。如果服從正態(tài)分布的話,就可以執(zhí)行T檢驗;反之,則需要使用非參數(shù)檢驗的方法。
那么,該如何使用SPSS檢驗數(shù)據(jù)是否服從正態(tài)分布呢?我們可以使用非參數(shù)檢驗中的KS檢驗、圖表中的Q-Q圖、描述統(tǒng)計中的偏度峰度系數(shù)、探索統(tǒng)計的正態(tài)驗證來進(jìn)行數(shù)據(jù)的正態(tài)分布檢驗。本文會先重點介紹KS檢驗與Q-Q圖。
一、KS檢驗
KS檢驗,是Kolmogorov-Smirnov檢驗的簡稱,中文譯為柯爾莫哥洛夫-斯米爾諾夫檢驗,是一種檢驗擬合優(yōu)度的檢驗方法,可用于檢驗數(shù)據(jù)是否服從理論分布,比如是否服從正態(tài)分布。
接下來,我們使用一組初中生的身高數(shù)據(jù)來作為示例數(shù)據(jù)。
圖1:示例數(shù)據(jù)
然后,如圖2所示,在SPSS的非參數(shù)檢驗菜單中,打開單樣本KS檢驗功能。
圖2:KS檢驗功能
如圖3所示,在KS檢驗設(shè)置面板中,重點是要進(jìn)行檢驗變量與檢驗分布的設(shè)置。本例需要檢驗的是身高樣本數(shù)據(jù)是否服從正態(tài)分布,因此,需要將身高變量添加到檢驗變量,并勾選檢驗分布中的“正態(tài)”選項。
在正態(tài)檢驗選項中,一般情況下,選擇默認(rèn)的“使用樣本數(shù)據(jù)”即可。
圖3:KS檢驗設(shè)置
然后,再打開選項面板,勾選所需的統(tǒng)計數(shù)值(建議勾選描述)與缺失值的處理方式。
圖4:選項設(shè)置
完成檢驗設(shè)置后,運行檢驗。
如圖5所示,在KS檢驗結(jié)果中,可以看到,當(dāng)前檢驗的分布是正態(tài)分布,而其漸進(jìn)顯著性數(shù)值為0.00<0.05,因此拒絕原假設(shè),也就是說,示例身高樣本數(shù)據(jù)不符合正態(tài)分布。
圖5:KS檢驗結(jié)果
二、Q-Q圖
Q-Q圖,是Quantile-Quantile圖的簡稱,通過計算兩個數(shù)據(jù)的分位數(shù)來繪制散點圖,從而檢驗數(shù)據(jù)是否服從理論分布。
正態(tài)Q-Q圖,即實測值與預(yù)期的正態(tài)值組成的散點圖。如果數(shù)據(jù)服從正態(tài)分布的話,數(shù)值在Q-Q圖的分布會呈現(xiàn)直線型;反之則不服從正態(tài)分布。
Q-Q圖屬于SPSS描述統(tǒng)計中的一種,如圖6所示,依次單擊分析-描述統(tǒng)計-Q-Q圖。
圖6:Q-Q圖功能
如圖7所示,基于本文的數(shù)據(jù)驗證目的—驗證身高樣本數(shù)據(jù)是否服從正態(tài)分布,需將身高變量添加到變量選項,并在檢驗分布中選取“正態(tài)”選項。其他選項,一般情況下,保持默認(rèn)即可。
圖7:Q-Q圖設(shè)置
完成以上設(shè)置后,運行檢驗。
從圖8的身高正態(tài)Q-Q圖看到,散點圖上的數(shù)值似乎接近與直線很接近。但由于身高的差別數(shù)值較小,我們還需要具體看看數(shù)值與直線的偏離大小。
圖8:身高正態(tài)Q-Q圖
從圖8的去趨勢正態(tài)Q-Q圖看到,實際上,實測值與正態(tài)的偏差還是比較大的,因此,不能確切說明身高樣本數(shù)據(jù)服從正態(tài)分布。
圖9:去趨勢正態(tài)Q-Q圖
三、小結(jié)
綜上所示,通過正態(tài)Q-Q圖,我們可以直觀地觀察到數(shù)據(jù)的正態(tài)分布情況,但當(dāng)數(shù)值與直線有一定偏離的情況下,還需要借助去趨勢正態(tài)Q-Q圖,以及KS檢驗來進(jìn)一步檢驗數(shù)據(jù)的正態(tài)性。
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |