win7系統(tǒng)下載
當前位置: 首頁 > 硬件軟件教程 > 詳細頁面

SPSS的系統(tǒng)聚類區(qū)分該如何用

發(fā)布時間:2024-05-04 文章來源:深度系統(tǒng)下載 瀏覽:

SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學習算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應用于教育、心理、醫(yī)學、市場、人口、保險等多個研究領域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。

對數(shù)據(jù)進行一定條件下的分類分組是數(shù)據(jù)分析中經(jīng)常需要的環(huán)節(jié),IBM SPSS Statistics為用戶提供了幾種常用的分類方法:快速聚類、二階聚類和系統(tǒng)聚類。

接下來我們就簡單演示一下SPSS的系統(tǒng)聚類分析方法該如何使用。

一、系統(tǒng)聚類

系統(tǒng)聚類也叫做分層聚類,主要的分析思路是將每個個體看做是一類,再將相似度較高的個體組成新的一類,再將新類之間根據(jù)相似度重復合并,直到歸類結(jié)束。

常用的系統(tǒng)聚類方法有最短距離法、最長距離法、質(zhì)心距離法等。

功能位置

圖1:功能位置

SPSS的系統(tǒng)聚類功能在“分析”菜單下的“分類”中,點擊可進入系統(tǒng)聚類分析的操作窗口。

二、操作方法

1.數(shù)據(jù)樣本

數(shù)據(jù)樣本

圖2:數(shù)據(jù)樣本

聚類分析適用于基數(shù)較大的數(shù)據(jù)樣本,為了便于理解,我們這里選擇的是一份學生成績單作為示例。

2.變量設置

變量設置

圖3:變量設置

我們這里是依據(jù)學生的單科成績、平均成績和總成績進行分析,所以將這些變量都移入“變量”窗口作為聚類依據(jù)。

學生序號移入“標注個案”窗口,注意這個窗口只能接受字符串格式的變量,必要時需要進行變量的格式修改。

選擇個案聚類,輸出內(nèi)容勾選統(tǒng)計量和圖。

3.統(tǒng)計量

統(tǒng)計量設置

圖4:統(tǒng)計量設置

這個對話框設置的是輸出統(tǒng)計量,合并進程表是每個進程中被合并的類和類間距離,相似性矩陣是觀測值之間的距離矩陣。

聚類成員輸出的是成員所屬分類的設置,選擇“無”即可。

4.繪制

繪制設置

圖5:繪制設置

我們將聚類圖形設置為譜系圖,冰柱圖設置為全部聚類,方向設置為垂直方向。

5.方法

聚類方法

圖6:聚類方法

前文我們有簡單提到幾種聚類方法,這個對話框內(nèi)顯示了所有SPSS中可用的聚類方法,我們選擇質(zhì)心聚類法。

度量標準有三個,區(qū)間、計算和二分類,一般數(shù)據(jù)使用的是區(qū)間度量,選擇區(qū)間中的平方歐式距離。

在這個分析方法中,標準化和轉(zhuǎn)換度量不需要進行特殊設置。

6.保存

保存設置

圖7:保存設置

用戶可以設置保存的內(nèi)容,可以不保存任何信息;也可以選擇保存單一方案,即將每一步的變量信息保存到新變量;或者選擇制定方案范圍,設置保存的上下限,本例中不做過多設置。

7.分析

譜系圖

圖8:譜系圖

在輸出日志中會查看到多個圖表,我們這里對譜系圖做一個簡單說明:如上圖,被樹狀連接的個案間、分類間具有相似性,從中我們可以發(fā)現(xiàn)多種分類方法,圖中標示的是較為明顯的一種,共分為五類,有兩個個案單獨成一類。

三、小結(jié)

系統(tǒng)聚類的概念比快速聚類復雜一點,但結(jié)果更為多樣,適合分析者嘗試多種類型的分類分析操作。


世界上許多有影響的報刊雜志就SPSS給予了高度的評價。
本文章關鍵詞: SPSS系統(tǒng)聚類區(qū)分