SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。 IBM SPSS Statistics探索性分析提供了數(shù)據(jù)過濾、離群值識別、假設(shè)檢驗等分析功能。在《應(yīng)用SPSS探索性分析,快速檢查數(shù)據(jù)異常值》一文中,我們應(yīng)用探索性分析檢查到數(shù)據(jù)中存在著極端值的情況。本節(jié),將會繼續(xù)應(yīng)用檢驗功能檢查數(shù)據(jù)的正態(tài)分布情況。
一、圖分析功能簡介
如圖1所示,IBM SPSS Statistics探索性分析中的圖功能包含了圖表的可視化以及正態(tài)性檢驗,簡單介紹如下:
1.箱圖,以最大值、最小值、中位數(shù)和兩個四分位數(shù)描述數(shù)據(jù),可檢查數(shù)據(jù)的對稱性與分散程度。
2.描述性,包含莖葉圖和直方圖。
3.帶檢驗的正態(tài)圖,包含正態(tài)性檢驗以及正態(tài)Q-Q圖。
4.含萊文檢驗的分布-水平圖,控制分布-水平圖的數(shù)據(jù)轉(zhuǎn)換。
接下來,我們將簡單應(yīng)用以上功能到本文的例子中,用以檢驗不同性別的客單價數(shù)據(jù)是否符合正態(tài)分布。
圖1:圖分析功能
二、應(yīng)用圖分析功能
1、設(shè)置圖分析選項
如圖2所示,分別勾選“直方圖”以及“含檢驗的正態(tài)圖”兩個選項,然后單擊“繼續(xù)”,獲取分析結(jié)果。
圖2:圖分析選項
2、解讀圖分析結(jié)果
首先,我們來看一下正態(tài)性檢驗的數(shù)值。如圖3所示,可以看到,男性客單價在兩種檢驗中均低于0.05的置信度,因此可以拒絕其正態(tài)分布的假設(shè)。
而女性客單價在柯爾莫哥洛夫-斯米諾夫檢驗(K-S檢驗)中高于0.05的置信度,在夏皮洛-威爾克檢驗(S-W檢驗)中低于0.05的置信度,因本例女性只有49個樣本,屬于小樣本,要采用S-W檢驗結(jié)果,即拒絕其正態(tài)分布的假設(shè)。
圖3:正態(tài)性檢驗
除了使用正態(tài)性檢驗數(shù)據(jù),我們還可以通過正態(tài)Q-Q圖,簡單看一下不同性別客單價的實測值與期望正態(tài)值的關(guān)系。當(dāng)數(shù)值分布于正態(tài)曲線上,表明變量符合正態(tài)分布。
如圖4所示,可以看到,男性的客單價偏離正態(tài)曲線,不符合正態(tài)分布。
圖4:男性客單價正態(tài)Q-Q圖
如圖5所示,女性的數(shù)值雖然都接近于正態(tài)曲線,但也有一些離散的值,如果樣本量大一點,可能效果會更好一點。
圖5:女性客單價正態(tài)Q-Q圖
然后,如圖5所示,選中已添加的地區(qū)變量,在新名詞處輸入重新編碼后的變量名稱:地區(qū)編碼,并將其添加為新名稱。
圖6:女性客單價直方圖
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |