SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。 神經(jīng)網(wǎng)絡(luò)是基于模仿生物大腦結(jié)構(gòu)及功能的信息處理系統(tǒng),可通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù),在模式識別、人工智能、預(yù)測、醫(yī)學(xué)等領(lǐng)域擁有廣闊的發(fā)展前景。
在本文中,會通過神經(jīng)網(wǎng)絡(luò)中的經(jīng)典例子鳶尾花,講解如何利用IBM SPSS Statistics實現(xiàn)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理和模型訓(xùn)練,從而得到相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型。
一、數(shù)據(jù)的標(biāo)準(zhǔn)化處理
在實際場景中應(yīng)用神經(jīng)網(wǎng)絡(luò)方法時,通常需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,以此消除數(shù)據(jù)之間的量綱差異,讓后續(xù)的數(shù)據(jù)使用更加方便。
本文使用的是一組包含三種類型的鳶尾花數(shù)據(jù),擁有四個指標(biāo),目的是通過四個指標(biāo)對鳶尾花的類型進行預(yù)測。
圖1:示例數(shù)據(jù)
首先,如圖2所示,在分析菜單中打開描述功能。
圖2:描述功能
如圖3所示,選中“將標(biāo)準(zhǔn)化值另存為變量”,點擊確定。
圖3:標(biāo)準(zhǔn)化值另存為變量
最終得到標(biāo)準(zhǔn)化的數(shù)據(jù),如圖4所示。
圖4:標(biāo)準(zhǔn)化數(shù)值
二、神經(jīng)網(wǎng)絡(luò)的實現(xiàn)
首先需要生成一個分組變量,將70%的樣本數(shù)據(jù)用于訓(xùn)練。如圖5所示,選擇數(shù)據(jù)菜單中的計算變量功能,設(shè)置目標(biāo)變量“分組”,使用數(shù)字表達式對變量分組。
圖5:變量分組
如圖6,在分析菜單中選中神經(jīng)網(wǎng)絡(luò),打開多層感知器功能。
圖6:多層感知器功能
接下來在功能面板中設(shè)置各項參數(shù),如圖7所示,在變量分區(qū)中設(shè)置因變量和因子。
圖7:設(shè)置參數(shù)
點擊分區(qū),如圖8所示,選擇已生成的分組變量。
圖8:分區(qū)變量選擇
再點擊輸出,選擇圖9中被選中的選項。
圖9:輸出選項
最后點擊保存,如圖10所示,選擇圖中的兩個選項,然后點擊確定。最終可得到這組數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型及訓(xùn)練結(jié)果。
圖10:保存
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |