SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 回歸分析,實(shí)際上構(gòu)建的就是數(shù)學(xué)模型,通過研究一組隨機(jī)變量與另一組變量之間的關(guān)系,構(gòu)建或簡單的、或復(fù)雜的數(shù)學(xué)方程式,并以此預(yù)測(cè)因變量的值。如果自變量與因變量之間存在著線性關(guān)系,就會(huì)構(gòu)建線性模型,也就是常見的線性回歸模型。
線性回歸模型如果僅包含一個(gè)自變量的話,可構(gòu)建簡單的一元線性回歸分析;如果包含多個(gè)自變量的話,則構(gòu)建多元線性回歸分析。本文將針對(duì)比較簡單的一元線性回歸分析,介紹如何使用IBM SPSS Statistics的線性回歸功能。
一、使用的數(shù)據(jù)
一元線性回歸衡量的是一個(gè)自變量x和一個(gè)因變量y的線性關(guān)系。鑒于該特點(diǎn),我們會(huì)使用一組包含客流量和銷售額的數(shù)據(jù),研究客流量作為自變量、銷售額作為因變量之間的線性關(guān)系。
圖1:示例數(shù)據(jù)
二、應(yīng)用線性回歸分析
如圖2所示,依次單擊分析-回歸-線性選項(xiàng),打開偏線性回歸設(shè)置面板。
圖2:線性回歸分析
1、選擇變量
在線性回歸設(shè)置面板中,首先需要分別將銷售額、客流量分別添加到右側(cè)因變量、自變量方框中。
圖3:選擇變量
2、指定進(jìn)入方法
然后,再對(duì)線性回歸指定進(jìn)入的方式,其方法含義如下:
1.輸入,將自變量全部放入回歸模型
2.步進(jìn),按照自變量貢獻(xiàn)度、剔除與否來決定自變量是否放入回歸模型
3.除去,先建立全自變量模型,然后再根據(jù)條件剔除自變量
4.后退,與除去相似,也是先建立全自變量模型,不同的是,后退是通過逐次剔除的方式剔除自變量
5.前進(jìn),將自變量逐次添加進(jìn)模型
由于本例分析的是簡單的一元線性回歸方程,可以按照默認(rèn)選擇“輸入”。
圖4:進(jìn)入方法
3、統(tǒng)計(jì)相關(guān)設(shè)置
接著,打開選項(xiàng)設(shè)置面板,指定回歸系數(shù)、殘差分析等統(tǒng)計(jì)數(shù)值;貧w系數(shù)即構(gòu)建線性回歸方程中的系數(shù),可勾選“估算值”。
為了了解模型預(yù)測(cè)的準(zhǔn)確度,需要勾選“模型擬合”選項(xiàng),了解模型的擬合度,并結(jié)合“描述”統(tǒng)計(jì)數(shù)值,查看平均值、方差等。
另外,在求得一元線性回歸方程后,為了檢驗(yàn)?zāi)P褪欠窬哂薪y(tǒng)計(jì)學(xué)意義,需分析其殘差是否存在自相關(guān),鑒于此,需勾選殘差分析中的“德賓-沃森(D-W)”檢驗(yàn)。
圖5:統(tǒng)計(jì)方法
4、標(biāo)準(zhǔn)化殘差圖
同時(shí),在圖選項(xiàng)中,勾選標(biāo)準(zhǔn)化殘差圖中的“直方圖”、“正態(tài)概覽圖”,分析殘差的自相關(guān)性、正態(tài)性。
圖6:標(biāo)準(zhǔn)化殘差圖
5、選項(xiàng)設(shè)置
如果進(jìn)入方法中選擇“步進(jìn)法”,可在選項(xiàng)中指定使用F概率或F值的形式。另外,回歸方程中如需包含常量,需勾選“在方程中包括常量”。
圖7:選項(xiàng)設(shè)置
三、小結(jié)
IBM SPSS Statistics的線性回歸分析,可構(gòu)建多個(gè)自變量與多個(gè)因變量的線性回歸方程,并以此進(jìn)行因變量值的預(yù)測(cè),而一元線性回歸方程是其中比較簡單的線性回歸分析,多用于分析影響因變量中的關(guān)鍵因素。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |