在各行業(yè)的統(tǒng)計(jì)工作中,經(jīng)常會(huì)在不同的維度上對(duì)因變量和自變量的關(guān)系進(jìn)行研究分析。比如我們要統(tǒng)計(jì)上海和北京在不同的時(shí)間維度上(上午、下午、晚上)的車流量,這種研究,它們之間的數(shù)據(jù)是非獨(dú)立的,彼此之間具有一定的關(guān)系。針對(duì)這種數(shù)據(jù)的研究,我們就不可采用普通的線性回歸、邏輯回歸,而需要使用廣義估算方程來進(jìn)行其他模型的擬合計(jì)算,下面使用SPSS軟件來為大家演示如何針對(duì)此情況進(jìn)行統(tǒng)計(jì)分析。
一、流程步驟
本文中演示的數(shù)據(jù)如圖1,第一列表示街道ID;第二列表示車流量;第三列表示是否堵塞(1表示堵塞,0表示不堵塞);第四列表示天氣(0表示天氣下雨;1表示天氣良好或晴朗);第五列表示城市(1為上海,2為北京)。
圖1:演示數(shù)據(jù)
第一步:點(diǎn)擊【分析】--【廣義線性模型】--【廣義估算方程】,在“重復(fù)”項(xiàng)中,輸入主體變量(選擇街道ID)和主體內(nèi)變量(選擇車流量),然后在下方的工作相關(guān)性矩陣中,本演示數(shù)據(jù)中需選擇“可交換”。
圖2:填寫重復(fù)項(xiàng)
工作相關(guān)性矩陣可選項(xiàng)有5個(gè),其中“自變量”表示各數(shù)據(jù)間相互獨(dú)立;“AR(1)”表示自相關(guān),相鄰數(shù)據(jù)間時(shí)間相距越大,則相關(guān)性越小;“可交換”表示等相關(guān),相鄰數(shù)據(jù)間的相關(guān)性是相等的;“M相關(guān)”表示相鄰相關(guān),即相鄰的M+1個(gè)數(shù)據(jù)有相關(guān)性,其他數(shù)據(jù)沒有相關(guān)性;“非結(jié)構(gòu)化”表示不限定相關(guān)結(jié)構(gòu)。
圖3:工作相關(guān)性矩陣
第二步:由于本演示數(shù)據(jù)是二分類數(shù)據(jù),因此接下來我們?cè)?ldquo;模型類型”中,選擇“二元Logistic”。
圖4:設(shè)置模型類型
第三步:在“響應(yīng)”菜單中,輸入因變量為“是否堵塞”,再點(diǎn)擊“參考類別”按鈕,設(shè)定參考類別為“第一個(gè)值”,表示設(shè)定不堵塞這個(gè)分類為參考分類。
圖5:設(shè)置響應(yīng)
第四步:在“預(yù)測(cè)變量”菜單的“協(xié)變量”中,填入“天氣”和“城市”作為模型的協(xié)變量,如圖6。
圖6:設(shè)置協(xié)變量
第五步:在“模型”菜單中,指定“天氣”和“城市”為模型效應(yīng),如圖7。
圖7:指定模型效應(yīng)
第六步:在“統(tǒng)計(jì)”菜單中,除了SPSS默認(rèn)幫我們勾選的項(xiàng)目外,我們還需要再勾選上“包括指數(shù)參數(shù)估算值”這一項(xiàng)。最后點(diǎn)擊“確定”,生成統(tǒng)計(jì)結(jié)果。
圖8:勾選包括指數(shù)參數(shù)估算值
二、結(jié)果分析
結(jié)果得到的多個(gè)表格,我們直接看“參數(shù)估算值”表格即可,見圖9,我們主要關(guān)注顯著性一列和Exp(B)一列,Exp(B)即上述我們勾選的“指數(shù)參數(shù)估算值”,也就是通常所說的OR值(比值比)。
在天氣這行中我們可以看到,顯著性為0.046,Exp(B)為0.341,這說明天氣晴朗造成堵塞的概率是天氣下雨造成堵塞的概率的0.341倍,且顯著性低于0.05,說明結(jié)論具有統(tǒng)計(jì)學(xué)意義;另外在城市一行中,我們可以看到顯著性為0.531,這說明城市這一自變量在此演示數(shù)據(jù)中不具有統(tǒng)計(jì)學(xué)意義。
圖9:參數(shù)估算值 |