SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類(lèi)分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 本文將針對(duì)分析過(guò)后的數(shù)據(jù)進(jìn)行詳細(xì)解讀。在解讀過(guò)程中,我們需要求得方程式的系數(shù),并判斷系數(shù)的擬合程度、方程式的統(tǒng)計(jì)學(xué)意義。
一、使用的數(shù)據(jù)
本文分析所用的數(shù)據(jù)是一組包含客流量與銷(xiāo)售額的數(shù)據(jù),研究的是以客流量為自變量、銷(xiāo)售額為因變量的線性關(guān)系。
圖1:示例數(shù)據(jù)
二、解讀檢驗(yàn)結(jié)果
1.模型擬合效果
模型摘要中的R方是判定系數(shù),其數(shù)值越接近于1,表明方程的擬合優(yōu)度越好,一般需要大于0.6。
從如圖2所示的模型摘看到,求得的一元線性回歸方程的R方為0.839,說(shuō)明本例分析所得的回歸方程擬合效果良好。
圖2:模型摘要
在判定回歸方程擬合優(yōu)度良好的情況下,查看ANOVA分析中的“回歸模型”方差分析。如圖3所示,“回歸模型”的顯著性值為0.00<0.05,說(shuō)明該“回歸模型”具有顯著的統(tǒng)計(jì)學(xué)意義,也就是說(shuō),客流量與銷(xiāo)售額之間存在著顯著的線性回歸關(guān)系。
圖3:ANOVA檢驗(yàn)2.構(gòu)建模型表達(dá)式
在判定回歸模型具有顯著統(tǒng)計(jì)學(xué)意義的前提下,進(jìn)一步檢驗(yàn)求得的系數(shù)是否通過(guò)T檢驗(yàn)。該T檢驗(yàn)的原假設(shè)為求得的回歸系數(shù)不具有統(tǒng)計(jì)學(xué)意義。
如圖4所示,可以看到回歸系數(shù)(客流量對(duì)應(yīng)的系數(shù))的顯著性數(shù)值為0.00<0.05,拒絕原假設(shè),也就是說(shuō)方程的回歸系數(shù)具有統(tǒng)計(jì)學(xué)意義,可構(gòu)建y=12.821x-2644.658的一元線性回歸方程。
圖4:選擇變量
3.殘差相關(guān)性分析
通過(guò)上述的分析,我們已經(jīng)可以認(rèn)為構(gòu)建的一元線性回歸方程y=12.821x-2644.658具有統(tǒng)計(jì)學(xué)意義,但是否可用于預(yù)設(shè)因變量的值,還需要通過(guò)殘差相關(guān)性分析。如果殘差存在自相關(guān)的話,模型的預(yù)測(cè)準(zhǔn)確度將會(huì)不高。
如圖5所示,模型的D-W值(德賓-沃森值)為2.060,查閱德賓-沃森表得到,樣本量n=198(采用200樣本量D-W值),控制變量數(shù)量k=1,其下臨界值LD=1.664、上臨界值UD=1.684。
根據(jù)D-W值的判定規(guī)則,本例的D-W值符合“如果UD
圖5:D-W檢驗(yàn)
另外,再通過(guò)殘差直方圖看到,殘差的分布趨近于正態(tài)曲線的分布。
圖6:殘差直方圖
再結(jié)合正態(tài)P-P圖分析,可以看到,數(shù)值的分布近似于直線,說(shuō)明殘差的正態(tài)性良好。
在滿(mǎn)足殘差無(wú)自相關(guān)性、服從正態(tài)分布的前提下,說(shuō)明本例構(gòu)建的一元線性回歸方程具有良好的預(yù)測(cè)性,可通過(guò)為自變量代入數(shù)值,求得預(yù)測(cè)的因變量。
圖7:殘差P-P圖
三、小結(jié)
綜上所述,在使用IBM SPSS Statistics構(gòu)建一元線性回歸方程時(shí),需要通過(guò)判定系數(shù)R方判斷回歸方程的擬合優(yōu)度,并檢驗(yàn)回歸方程、方程系數(shù)的是否具有統(tǒng)計(jì)學(xué)意義。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |