我們在執行信效度的分析中,經常會使用探索性因素分析(Exploratory factor analysis, EFA)進行效度的探討,在使用EFA從多個題目萃取出精簡因子的時候,研究者會參考「特徵值(eigenvalue)」這個參數,本文主要透過簡單的數學推演來了解「特徵值」跟「特徵向量(eigenvector)」的實務意涵。
在線性代數中,特徵值 (Eigenvalue) 與特徵向量 (Eigenvector) 是線性變換核心概念,當一個矩陣作用於某個向量時,如果該向量的方向保持不變,僅發生「長度縮放」,那麼這個向量就是特徵向量,而縮放的「倍率」就是特徵值。
一、數學公式
有關特徵值的矩陣公式我們可以參考如下,特別注意v要是非零向量,因為零向量與任何常數都成立,沒有實際推估的意義。
要找出特徵值,我們要先做一些簡單的代數變換,首先我們先進行移項的動作:
1.1、移項(將右項移到左項)
1.2、帶入單位矩陣I
為了提取公因式矩陣v,我們帶入單位矩陣I進行轉換,如下。
1.3、判定非奇異性
這是一個齊次線性方程組(Homogeneous Linear Equations),根據定義,我們要求v向量有非零解,則係數矩陣(A-λI)必須是不可逆的(奇異矩陣),此時其行列式必須為0,便是我們熟知的特徵方程式,可寫為:
det(A-λI)=0
接著求解便可得到特徵值與特徵向量。
二、實務推演(數據為模擬數據,實際分析數據結果不完全一致)
我們接著用一筆模擬的數據來進行推演,可以更進一步的了解兩者之間的關係。下表為10個受試者,有5個題目要進行因素萃取。
表1 模擬資料
2.1、計算題目的相關係數
接著我們算出這5題的相關係數,大致參考如下。
2.2、建立特徵方程式
根據上述分析,我們目前的相關矩陣R如下:
要解出特徵值λ,我們必須令其特徵行列式為零,亦即det(R-λI)=0。將R-λI展開,我們會得到一個對角線減去λ的矩陣:
接著我們就要進行求解了。
2.3、冪次法 (Power Method)
因為傳統的五階求解非常麻煩,因此一般軟體運算會採用特徵值疊代(iteration)的方式去進行計算,其步驟如下。
2.3.1 設定初始特徵向量V0
假設一個初始權重向量V0(假設每個題目權重一樣)
2.3.2 將原始資料相關矩陣R乘上V0
將相關矩陣R乘以V0,這相當於把矩陣每一列的元素加總。
2.3.3 正規化並提取特徵值
我們從V0結果向量中提取最大值的絕對值作為估計特徵值,在此範例中是2.26,將剛剛的向量除以2.26進行正規化,可得V1如下。
2.3.4 重複疊代R乘上Vn的過程
由於每次疊代都會產出一個新的估計特徵值,系統會重複進行疊代的動作,直到特徵值趨於穩定(例如兩次估計特徵值差異小於0.0001),如此便算是完成第一個因子特徵值λ1的疊代,以本例而言第1因子的特徵值是4.7。
2.3.5 將已估出的因子影響力從矩陣中排出
當第一個因子特徵值被求出之後,我們便可以計算剩餘的相關矩陣Rnew
Rnew去跟新設定的V0進行相乘,並疊代出第2個特徵值(依本例而言是0.147),後續依此類推。
三、特徵值及特徵向量實際意涵
根據上述的推導,我們可以理解「相關矩陣本質上是各題之間的關係,透過求得其特徵向量(例如v1),我們可以找到矩陣數據結構中不隨相乘而偏轉方向的穩定向量,也就是我們說的因素(v1我們實務上就稱為因素1)」,而對應的特徵值則代表了該方向捕捉到的變異量強度(縮放比例),讓我們能判斷該因素的重要性。
在SPSS軟體中,我們可以透過分析->維度縮減進行探索性因素分析,就可以求得因素分析的結果。
以上為特徵值與特徵向量的說明,若有統計相關需求再請與我們聯繫,也請給我們一個google好評,謝謝~










