SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 回歸分析是處理數(shù)據(jù)、分析數(shù)據(jù)特征和關(guān)系的一種重要方法,在各個(gè)領(lǐng)域的數(shù)理統(tǒng)計(jì)分析中都非常有用;貧w分析中有多種分析方法,接下來我們要介紹的是IBM SPSS Statistics中的曲線估算分析方法。
一、曲線估算
和線性回歸的原理類似,曲線估算也是以最小二乘法為基礎(chǔ),來分析曲線關(guān)系資料在數(shù)量變化上的特征和規(guī)律的一種回歸分析方法。
圖1:曲線估算
在“分析”菜單中找到“回歸”,點(diǎn)擊其中的“曲線估算”,可以打開曲線估算的分析窗口。
二、操作方法
1.數(shù)據(jù)樣本
圖2:數(shù)據(jù)樣本
這是一份從1978年到2005年某地區(qū)人均收入和部分支出情況的統(tǒng)計(jì)表,使用曲線估計(jì)可以分析年人均可支配收入和教育支出的基本關(guān)系。
2.變量設(shè)置
圖3:變量設(shè)置
曲線估計(jì)中需要設(shè)置三個(gè)變量:因變量、自變量和標(biāo)簽變量,我們要探究教育支出隨人均可支配收入變化的關(guān)系,所以將教育支出移入到因變量窗口內(nèi)。
自變量的選擇要分為兩類:時(shí)間變量和數(shù)字變量,時(shí)間變量是一個(gè)特例,如果自變量是以時(shí)間為刻度變化的,就需要點(diǎn)擊選擇“獨(dú)立”中的“時(shí)間”,SPSS會(huì)自動(dòng)生成一個(gè)時(shí)間變量以進(jìn)行曲線估計(jì)。
我們這里使用數(shù)字變量即可,點(diǎn)擊“變量”,將“人均可支配收入”移入該窗口。
個(gè)案標(biāo)簽是用來標(biāo)記觀測距離的變量,將年份移入框內(nèi)。
3.模型設(shè)置
圖4:模型設(shè)置
我們需要選擇一個(gè)或多個(gè)模型以便于SPSS開始分析,每個(gè)模型都是自變量和因變量之間的變化關(guān)系,這里選擇的是線性、二次、復(fù)合和三次。
勾選“在方程中包括常量”、“模型繪圖”和“顯示ANOVA”表。
4.保存設(shè)置
圖5:保存設(shè)置
這個(gè)對話框內(nèi)可以設(shè)置保存的變量類型,包括預(yù)測值、殘差和預(yù)測區(qū)間,如果是時(shí)間變量,將會(huì)激活右側(cè)的預(yù)測個(gè)案窗口,這里我們不做設(shè)置。
5.分析結(jié)果
圖6:分析結(jié)果
在輸出日志窗口中,可以看到每個(gè)回歸模型的分析結(jié)果,根據(jù)模型的顯著性系數(shù)小于0.05則該模型顯著,可以判斷線性、立方和復(fù)合模型都是可信的,且三次模型最可信。
圖7:回歸圖
在分析結(jié)果最后,有一個(gè)完整的散點(diǎn)圖來表示因變量和自變量之間的回歸關(guān)系,比較觀測值和回歸曲線、不同的回歸曲線,可以分析得出該樣本的最佳回歸模型是三次模型。
三、小結(jié)
本文中我們主要介紹了曲線估計(jì)以及如何進(jìn)行簡單的SPSS曲線估算分析,這個(gè)方法適用于絕大多數(shù)的連續(xù)型的數(shù)字變量,希望可以對大家有所幫助!
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評價(jià)。 |