發(fā)布時間:2024-05-04 文章來源:深度系統(tǒng)下載 瀏覽:
SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學習算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應用于教育、心理、醫(yī)學、市場、人口、保險等多個研究領域,也用于產(chǎn)品質量控制、人事檔案管理和日常統(tǒng)計報表等。 在存在多個數(shù)據(jù)源的情況下,經(jīng)常會使用到IBM SPSS Statistics的數(shù)據(jù)合并功能,對多個數(shù)據(jù)源的數(shù)據(jù)進行合并。 比如在收集地區(qū)數(shù)據(jù)時,需要不同地區(qū)的人員分開收集,而在數(shù)據(jù)匯總的階段,就需要使用到數(shù)據(jù)合并的功能將這些不同來源的數(shù)據(jù)合并匯總。本節(jié),我們將會重點學習變量的合并。 一、打開需合并的數(shù)據(jù) 變量合并的作用是將不同數(shù)據(jù)文件中,相同個案的不同變量數(shù)據(jù)進行合并。比如數(shù)據(jù)A包含了年齡、性別等數(shù)據(jù),而數(shù)據(jù)B包含了地區(qū)、收入等數(shù)據(jù),而這些數(shù)據(jù)都是來自同一批個案,就可以通過變量合并數(shù)據(jù)。 首先,在SPSS中分別打開兩個需要合并的數(shù)據(jù)文件。
圖1:打開數(shù)據(jù) 如圖2所示,可以看到,兩個數(shù)據(jù)文件中存在著賬號、性別、客單價三個相同變量,以及Area、地區(qū)、來源、點擊頁面數(shù)四個不同變量,其中地區(qū)與Area實際為同一個變量,但命名方式不同。
圖2:對比變量差異 二、使用變量合并功能 接著,如圖3所示,依次打開數(shù)據(jù)-合并文件-添加變量,針對數(shù)據(jù)文件的異同點進行變量合并。
圖3:變量合并功能 由于當前打開的是數(shù)據(jù)集2,因此最終的數(shù)據(jù)會合并到數(shù)據(jù)集2中。如圖4所示,以數(shù)據(jù)集2為基礎,與之前已打開的數(shù)據(jù)集3進行合并。
圖4:指定合并的數(shù)據(jù)文件 接著,如圖5所示,打開變量選項卡,進行變量合并的設置。 其中,變量括號中含+的是數(shù)據(jù)集2中不包含的變量,而含*的是數(shù)據(jù)集2中包含的變量。設置的變量含義如下: 排除的變量,即兩個數(shù)據(jù)文件中存在差異的,但在合并數(shù)據(jù)過程中需要剔除的變量。 包含的變量,即兩個數(shù)據(jù)文件中存在差異的,但在合并數(shù)據(jù)過程中需要保留的變量。 鍵變量,即兩個數(shù)據(jù)文件同時包含的變量。
圖5:設置變量的合并方式 由于變量“地區(qū)”與“Area”實際為同一變量,可將其中一個添加為“包含的變量”,另外,還可以通過重命名的方法,將“Area”重命名為“地區(qū)”。
圖6:重命名變量 如圖6所示,可以看到“Area”已重命名為“地區(qū)”,將其添加為“包含的變量”。
圖7:完成變量的重命名 如圖7所示,在包含的變量中,“Area”變量已經(jīng)重命名為“地區(qū)”變量。當然,我們也可以直接使用數(shù)據(jù)集2中包含的“地區(qū)”變量。
圖8:添加重命名后的變量 完成以上操作后,如圖8所示,可以看到,變量已經(jīng)合并完成。后續(xù),可對數(shù)據(jù)作進一步的整理,如排序等。
圖9:完成變量的合并 世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |