Seemingly Unrelated Regression(以下簡寫為SUR,似不相關迴歸)是一種在多重迴歸模型中,亦即同時估計多個方程式(多個依變數)的統計方法。雖然這些方程式表面上看似「不相關」,但實際上它們的誤差項(error terms)之間可能存在相關性。傳統我們以普通最小平方法(OLS)估計實會假設多條迴歸模型之間的誤差項相關為0,數學上可以寫作Cov(ε1,ε2)=σ12=0,而當Cov(ε1,ε2)不為0十,則會導致OLS分析不符合有效性的假設。
SUR 透過同時估計多個方程式並考慮這些誤差項的相關結構,能提供更有效(更精確,變異更小)的參數估計。以下我們針對OLS跟SUR兩種方法進行細節說明跟比較,用以探討SUR實際上改善了OLS哪些部分。
一、數學公式比較
(一)普通最小平方法(OLS)
- 單一方程模型(矩陣形式)
y=Xβ+ε
其中誤差項一般設為N(0, σ),設定為常態分配,且平均為0變異為σ。在OLS的基本假設中,多條迴歸誤差項之間的相關為0,Cov(ε1,ε2)=0。
- OLS 估計量
OLS 以最小化平方殘差為目標,可導出以下公式。我們可將OLS解析解的部分跟後續SUR解析解的部分做比較,藉此了解兩者之間的差異。
(二)Seemingly Unrelated Regression(SUR,似不相關迴歸)
- SUR多方程式
SUR基本上用於多條迴歸分析中,因此方程式會有多個方程式,多個方程式可以表達如下。
這個部分要特別注意Cov(ε1,ε2)= σ12,這點也是SUR中最重要的部分,也就是會估計不同迴歸方程式之間的誤差相關。
- SUR 估計量(廣義最小平方法 GLS)
SUR 採 Generalized Least Squares (GLS),考慮多方程誤差的相關結構,參考如下。我們對比OLS的估計量便可知,SUR估計量主要便是將「Var(ε)反矩陣」放入原本OLS的兩個估計矩陣中,我們接著採用一個範例來進行解讀。
二、範例資料呈現
(一)方程式設定
我們設定兩個方程式,第一個方程式如下,依變數為門診就診量(Y1),自變數為人口密度(X1)。
第二個方程式如下,依變數為急診就診量(Y2),自變數為政策實施的虛擬變數(X2)。
(二)數據設定及估計值推算
數據設定如下,其中X1跟X2矩陣第一排的1是截距項。
- OLS推算
可算出第一個方程式的截距為5,Beta1為2.4;第二個方程式的截距為1.2,Beta2為0.3。我們先複習一下OLS的矩陣公式:
- SUR推算
我們在進行計算前,將誤差共變異數矩陣的細節陳列如下。
因為SUR要採用誤差共變異數矩陣,我們要先透過OLS求得殘差(ε矩陣)與其共變異數矩陣,因為我們用殘差來估計誤差。
接著我們用殘差算出殘差共變數矩陣,根據結果可以發現SUR的殘差共變異數矩陣並不為0。
由此可知,SUR的估計結果應與OLS有差,因為共變異數矩陣的交乘項不為0(本例為-0.16)。
- SUR 估計量的計算 (FGLS)
- 計算SUR估計值前半部矩陣值
我們根據Step 3得到的矩陣結果,帶入Step4進行計算,得到SUR Beta前半部的矩陣估計結果。
- 計算SUR估計值後半部矩陣值
我們可以根據OLS計算跟Step 3的結果,可以計算出SUR後半部矩陣的數值。
- 求出SUR估計值的計算
我們把上述資料都求出後,最後可得出SUR矩陣為5.1667、2.3333、1.1667、0.3333,對比上述OLS矩陣為5、2、1.2、0.3,兩者之間的差異便來自於殘差之間共變異數矩陣的差異,SUR會較OLS更為精確。
統整以上,我們可以透過數學公式跟實際範例了解多組迴歸方程中,SUR比起傳統OLS有更精確的結果,對於研究結果的估計更為有效。
如果本篇文章對您有幫助,請給我們一個Google好評喔~

















