羅吉斯迴歸主要用於依變數為二維變數(0,1)的時候,以下將詳細說明其原理及SPSS操作。

一、使用狀況

羅吉斯迴歸類似先前介紹過的線性迴歸分析,主要在探討依變數與自變數之間的關係。線性迴歸中的依變數(Y)通常為連續型變數,但羅吉斯迴歸所探討的依變數(Y)主要為類別變數,特別是分成兩類的變數(例如:是或否、有或無、同意或不同意……等)。

*【小常識】

在羅吉斯迴歸分析中,自變數x可以是類別變數,也可以是連續變數

二、前提假設

(一) 羅吉斯分配中,自變數對依變數的影響是以指數的方式做變動,因此不需要常態分配的假設。

(二)令依變數Y為二元反應的變數(成功或失敗),p為其成功的機率,受自變數所影響,則p之關係如下:

Y事件成功的機率

Y事件失敗的機率

*【小常識】

p的值介於0~1之間,p接近0時表示Y成功的機會很小,接近1時則表示成功的機會很大

(三) 勝算(Odds),即事件成功機率與失敗機率的比值。

以下採實驗設計為例:

  事件成功 事件失敗 總和
實驗組 4

(a)

16

(b)

20

(a+b)

對照組 1

(c)

19

(d)

20

(c+d)

  5

(a+c)

35

(b+d)

40

(a+b+c+d)

實驗組的勝算(Experimental event odds) = a/b = 4/16 = 0.25

控制組的勝算(Control event odds) = c/d = 1/19=0.053

勝算比(odds ratio) = (a/b) / (c/d) = ad/bc = 4.72

(四) 羅吉斯迴歸式:對勝算值(Odds)取自然對數(ln)即得之。

係數值( )→用來計算當 的值增加一單位時勝算的改變量(Δ odds)。

當 Δ odds > 1,表示當X增加時,事件發生的勝算會提高

Δ odds < 1,表示當X增加時,事件發生的勝算會降低

*【小常識】

Δ odds 又稱為OR,在SPSS中以EXP(B)表示。

三、假說檢定

羅吉斯迴歸模型的顯著性檢定(F test):探討羅吉斯迴歸模型中的β係數是否全部為0。當係數不全為0時,迴歸模型才具有預測力。

虛無假說(Null hypothesis)→ 
對立假說(alternative hypothesis)→ 

統計值(Statistics)→

四、SPSS 操作Example

【例題1】某公司欲根據過去「溫度」與「零件測試成功與否」的資料,建立以 溫度預測零件測試成功機率之迴歸模式。

→本題例子為二元羅吉斯迴歸,以一個連續型的自變數(溫度)去預測y(零件測試成功與否)。其中,y=1表示零件測試成功,y=0表示零件測試失敗。

(一)在SPSS中輸入欲分析之資料。

(二)二元羅吉斯迴歸:分析→迴歸→二元Logistic

(三) 因變數:零件測試成功與否(y)

共變量:溫度(即自變數x)

(四) 報表結果:

1. 模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉斯迴歸模型中的β係數是否全部為0。

在本例中,顯著性p值<0.001,拒絕虛無假說。

→此羅吉斯迴歸模型顯著,具有預測能力。

2. 模式摘要:呈現關於解釋力之「-2對數概似」、「Cox-Snell R平方」、

「Nagelkerke R 平方」的值做為參考。

3. 分類表:呈現預測值的準確度。

4.方程式中的變數:可得到羅吉斯迴歸式Δ odds(OR值)

(1) 根據上表我們可以得出以下的羅吉斯迴歸式

(2) Exp(B)=1.597(= ),即Δ odds=1.597>1,表示溫度每上升一度,零件測試成功機率會比零件測試失敗機率多出1.597倍。

【例題2】某醫療單位欲根據過去肺部疾病就診病患的基本資料,建立以有無「吸菸」、有無「家族病史」預測「罹患肺癌」機率之迴歸模式。

→本題例子為二元羅吉斯迴歸,以兩個類別型的自變數(吸菸、家族病史)去預測y(罹患肺癌與否)。其中,y=1表示罹患肺癌,y=0表示沒有罹患肺癌。

(一)在SPSS中輸入欲分析之資料。

(二)二元羅吉斯迴歸:分析→迴歸→二元Logistic

(三) 因變數:罹癌與否(y)

共變量:吸菸與否(即自變數x1)

有無家族病史(即自變數x2)

(四)類別→指定類別共變量:吸菸(x1)、家族病史(x2)

(五) 選項:Exp(B)之信賴區間(X)

(六) 報表結果:

1. 模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉斯迴歸模型中的β係數是否全部為0。

在本例中,顯著性p值<0.001,拒絕虛無假說。

→此羅吉斯迴歸模型顯著,具有預測能力。

2.模式摘要:呈現關於解釋力之「-2對數概似」、「Cox-Snell R平方」、

「Nagelkerke R 平方」的值做為參考。

3.分類表:呈現預測值的準確度。

4.方程式中的變數:可得到羅吉斯迴歸式Δ odds(OR值)

根據上表可知

(1) 吸菸Exp(B)=0.031,即Δ odds=0.031,表示沒有吸菸的人( =0)罹患肺癌的機率是有吸菸的人( =1)罹患肺癌機率的0.031倍。

(2)家族病史Exp(B)=0.029,即Δ odds=0.029,表示沒有家族病史的人( =0)罹患肺癌的機率是有家族病史的人( =1)的0.029倍。

由於上述兩個變數皆達顯著(p<.05),故我們可以推論此筆病患資料中「罹患肺癌與否」與「吸菸」及「有無家族病史」有直接關係。

本次教學的檔案有兩個範例,檔案如下所示,僅供同學練習使用:

範例一: https://drive.google.com/file/d/0B8eyCgO9lPB0NHBVazVyZk9BVDA/view?usp=sharing

範例二:https://drive.google.com/file/d/0B8eyCgO9lPB0Ynd3OXlGMHMyNDQ/view?usp=sharing