SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 獨(dú)立樣本T檢驗(yàn)與平均值檢驗(yàn)、單樣本T檢驗(yàn)、配對樣本T檢驗(yàn)均屬于比較平均值的檢驗(yàn)方法。不同的是,獨(dú)立樣本T檢驗(yàn)比較的是兩組個(gè)案的平均值。該檢驗(yàn)需要符合隨機(jī)分布的假定,也就是說,兩組個(gè)案數(shù)據(jù)間的差異無其他人為的影響因素。
需要注意的是,“獨(dú)立樣本T檢驗(yàn)”檢驗(yàn)的是兩組個(gè)案,而不是兩個(gè)變量,因此需要構(gòu)建個(gè)案組數(shù)據(jù);另外,其分組變量需用數(shù)值標(biāo)識。這兩點(diǎn)在IBM SPSS Statistics軟件操作中需格外注意。
一、打開數(shù)據(jù)文件
本例子檢驗(yàn)的是飲用牛奶A組與飲用牛奶B組的初中生身高平均值是否有顯著性差異。
如圖1所示,示例數(shù)據(jù)展現(xiàn)的是飲用牛奶A與飲用牛奶B兩個(gè)個(gè)案組的身高數(shù)據(jù),如您使用的數(shù)據(jù)是兩個(gè)變量的變量組數(shù)據(jù)(即包含飲用牛奶A與飲用牛奶B兩個(gè)變量的數(shù)據(jù)),需通過將變量數(shù)據(jù)轉(zhuǎn)換為個(gè)案數(shù)據(jù)后才能進(jìn)行后續(xù)操作。
但另一方面,示例數(shù)據(jù)中的飲用牛奶類型變量使用的是字符串值,我們需要先將字符串轉(zhuǎn)換為數(shù)值,才能進(jìn)行獨(dú)立樣本T檢驗(yàn)。
圖1:示例數(shù)據(jù)
二、為飲用牛奶類型變量重新編碼
如圖2所示,打開IBM SPSS Statistics轉(zhuǎn)換菜單中的“重新編碼為不同變量”。
圖2:重新編碼為不同變量
然后,如圖3所示,將需要重新編碼的“飲用牛奶類型”變量添加到右側(cè)輸出變量方框中,并在名稱輸入框中為其命名為“飲用牛奶類型編碼”。
接著,單擊“舊值和新值”按鈕,匹配舊值與新值。
圖3:設(shè)置輸出變量
如圖4所示,在舊值與新值匹配面板中,分別將飲用牛奶A、飲用牛奶B與數(shù)值1、2相匹配。
圖4:匹配舊值與新值
完成變量的重新編碼后,返回?cái)?shù)據(jù)集,如圖5所示,數(shù)據(jù)中出現(xiàn)了新的變量—飲用牛奶類型編碼。
圖5:完成變量的重新編碼
為了讓重新編碼后的變量值含義更加明確,如圖6所示,我們可以打開變量視圖,編輯變量的值標(biāo)簽。
圖6:編輯變量的值標(biāo)簽
如圖7所示,在值標(biāo)簽設(shè)置面板,分別將值1、2標(biāo)簽為飲用牛奶A、飲用牛奶B。
圖7:設(shè)定標(biāo)簽
如圖8所示,返回變量視圖,可以看到,值標(biāo)簽已經(jīng)編輯完成。
圖8:完成標(biāo)簽設(shè)定
三、應(yīng)用獨(dú)立樣本檢驗(yàn)
完成數(shù)據(jù)的處理后,就可以打開IBM SPSS Statistics的獨(dú)立樣本T檢驗(yàn)功能(分析-比較平均值-獨(dú)立樣本T檢驗(yàn)),正式開啟數(shù)據(jù)的檢驗(yàn)。
圖9:獨(dú)立樣本檢驗(yàn)功能
上一節(jié),我們重點(diǎn)講解了IBM SPSS Statistics獨(dú)立樣本T檢驗(yàn)的檢驗(yàn)原理、數(shù)據(jù)要求以及數(shù)據(jù)轉(zhuǎn)換的方法。這部分的內(nèi)容相當(dāng)重要,建議先理解了上一節(jié)內(nèi)容再學(xué)習(xí)本節(jié)的實(shí)例操作。
如圖1所示,可以看到,獨(dú)立樣本T檢驗(yàn)僅包含了檢驗(yàn)變量,因此,需要使用個(gè)案組數(shù)據(jù)進(jìn)行檢驗(yàn),而其分組變量是作為標(biāo)識兩組個(gè)案使用的。接下來,我們通過示例數(shù)據(jù)學(xué)習(xí)下操作。
圖1:獨(dú)立樣本T檢驗(yàn)
一、選擇變量
首先,了解下設(shè)置面板中的變量概念:
1. 檢驗(yàn)變量,即檢驗(yàn)均值是否存在顯著性差異的變量數(shù)值。
2. 分組變量,即用于標(biāo)識兩組個(gè)案的變量。
本例中,我們需要檢驗(yàn)的是飲用牛奶A組與飲用牛奶B組的平均身高數(shù)據(jù)是否有差異。因此,需要將身高變量添加為檢驗(yàn)變量,將飲用牛奶類型編碼添加為分組變量。
然后,單擊定義組按鈕。
圖2:選擇變量
二、定義組
如圖3所示,在定義組設(shè)置面板,需要設(shè)置個(gè)案組對應(yīng)的編碼數(shù)值,必須是數(shù)值型值。上一節(jié)中,我們已經(jīng)將飲用牛奶類型變量重新編碼為值1、2,因此,可以直接將其與組1、2匹配。
圖3:定義組
三、選項(xiàng)設(shè)置
接著,打開“選項(xiàng)”按鈕,設(shè)置檢驗(yàn)分析的置信區(qū)間,一般情況下,設(shè)置為95%能確保較大的準(zhǔn)確性。同時(shí),設(shè)置“按具體分析排除個(gè)案”的缺失值處理方式。
圖4:選項(xiàng)設(shè)置
四、分析結(jié)果解讀
完成以上設(shè)置后,運(yùn)行分析,如圖5所示,數(shù)據(jù)中分別包含63個(gè)飲用牛奶A與63個(gè)飲用牛奶B的身高數(shù)據(jù),從其平均值看到,飲用牛奶A組的身高均值高于飲用牛奶B組的身高均值,但其差異是否顯著還要看顯著性數(shù)據(jù)。
圖5:描述統(tǒng)計(jì)數(shù)值
如圖6所示,從獨(dú)立樣本檢驗(yàn)圖表的數(shù)據(jù)看到,顯著性(雙尾)的數(shù)值0.711大于0.05(95%置信區(qū)間下),不能拒絕原假設(shè),也就是說,飲用牛奶A組的身高均值與飲用牛奶B組的身高均值無顯著性差異。
圖6:結(jié)果不顯著
以上就是IBM SPSS Statistics獨(dú)立樣本T檢驗(yàn)的應(yīng)用介紹。該功能用于比較兩組個(gè)案的均值差異,可用于驗(yàn)證兩個(gè)對比個(gè)案組的均值數(shù)值是否有顯著性差異,比如用于藥物研究領(lǐng)域,驗(yàn)證兩種藥物有效性是否有差異等。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評價(jià)。 |