Seemingly Unrelated Regression(以下簡寫為SUR,似不相關迴歸)是一種在多重迴歸模型中,亦即同時估計多個方程式(多個依變數)的統計方法。雖然這些方程式表面上看似「不相關」,但實際上它們的誤差項(error terms)之間可能存在相關性。傳統我們以普通最小平方法(OLS)估計實會假設多條迴歸模型之間的誤差項相關為0,數學上可以寫作Cov(ε1​,ε2​)=σ12​=0,而當Cov(ε1​,ε2​)不為0十,則會導致OLS分析不符合有效性的假設。

SUR 透過同時估計多個方程式並考慮這些誤差項的相關結構,能提供更有效(更精確,變異更小)的參數估計。以下我們針對OLS跟SUR兩種方法進行細節說明跟比較,用以探討SUR實際上改善了OLS哪些部分。

一、數學公式比較

(一)普通最小平方法(OLS)

  1. 單一方程模型(矩陣形式)

y=Xβ+ε

其中誤差項一般設為N(0, σ),設定為常態分配,且平均為0變異為σ。在OLS的基本假設中,多條迴歸誤差項之間的相關為0,Cov(ε1​,ε2​)=0。

  1. OLS 估計量

OLS 以最小化平方殘差為目標,可導出以下公式。我們可將OLS解析解的部分跟後續SUR解析解的部分做比較,藉此了解兩者之間的差異。

(二)Seemingly Unrelated Regression(SUR,似不相關迴歸)

  1. SUR多方程式

SUR基本上用於多條迴歸分析中,因此方程式會有多個方程式,多個方程式可以表達如下。

這個部分要特別注意Cov(ε1,ε2)= σ12,這點也是SUR中最重要的部分,也就是會估計不同迴歸方程式之間的誤差相關。

  1. SUR 估計量(廣義最小平方法 GLS)

SUR 採 Generalized Least Squares (GLS),考慮多方程誤差的相關結構,參考如下。我們對比OLS的估計量便可知,SUR估計量主要便是將「Var(ε)反矩陣」放入原本OLS的兩個估計矩陣中,我們接著採用一個範例來進行解讀。

二、範例資料呈現

   (一)方程式設定

我們設定兩個方程式,第一個方程式如下,依變數為門診就診量(Y1),自變數為人口密度(X1)。

第二個方程式如下,依變數為急診就診量(Y2),自變數為政策實施的虛擬變數(X2)。

(二)數據設定及估計值推算

數據設定如下,其中X1跟X2矩陣第一排的1是截距項。

  1. OLS推算

可算出第一個方程式的截距為5,Beta1為2.4;第二個方程式的截距為1.2,Beta2為0.3。我們先複習一下OLS的矩陣公式:

  1. SUR推算

我們在進行計算前,將誤差共變異數矩陣的細節陳列如下。

因為SUR要採用誤差共變異數矩陣,我們要先透過OLS求得殘差(ε矩陣)與其共變異數矩陣,因為我們用殘差來估計誤差。

接著我們用殘差算出殘差共變數矩陣,根據結果可以發現SUR的殘差共變異數矩陣並不為0。

由此可知,SUR的估計結果應與OLS有差,因為共變異數矩陣的交乘項不為0(本例為-0.16)。

  1. SUR 估計量的計算 (FGLS)

  1. 計算SUR估計值前半部矩陣值

我們根據Step 3得到的矩陣結果,帶入Step4進行計算,得到SUR Beta前半部的矩陣估計結果。

  1. 計算SUR估計值後半部矩陣值

我們可以根據OLS計算跟Step 3的結果,可以計算出SUR後半部矩陣的數值。

  1. 求出SUR估計值的計算

我們把上述資料都求出後,最後可得出SUR矩陣為5.1667、2.3333、1.1667、0.3333,對比上述OLS矩陣為5、2、1.2、0.3,兩者之間的差異便來自於殘差之間共變異數矩陣的差異,SUR會較OLS更為精確。

統整以上,我們可以透過數學公式跟實際範例了解多組迴歸方程中,SUR比起傳統OLS有更精確的結果,對於研究結果的估計更為有效。

如果本篇文章對您有幫助,請給我們一個Google好評喔~