KS檢定(Kolmogorov-Smirnov檢定)在信用評分卡模型中被廣泛使用的原因,主要在於它能夠有效評估模型的區分能力,即模型是否能有效區分好客戶(無違約)與壞客戶(違約)。
1、KS檢定目的
KS檢定是一種無母數統計方法,用於比較兩個分佈的差異。在信用評分卡模型中,KS檢定用來比較好客戶和壞客戶的信用分數累積分佈函數(CDF)。舉例而言:
好客戶的信用分數分佈通常偏向高分,壞客戶的信用分數分佈通常偏向低分。KS統計量測量兩個累積分佈函數之間的最大差異(即KS值),這個差異越大,表示模型對好壞客戶的區分能力越強,KS分析可以從SPSS分析的描述性統計模組中完成。
我們可以從下圖看出,WoE越大的組別,好樣本會越多,壞樣本會越少,因此如果風險分數模型是有區別性的,我們會預期看到較高的KS檢定值(D值)。
2、KS檢定公式
Kolmogorov-Smirnov檢定的統計公式如下,我們可以看到D值便是將兩個CDF分布進行域值中最大值的選取,藉此檢定模型的區別程度。一般而言:
- D < 0.2 (20%):模型區分能力較差。
- D = 0.2 -0.4(20%~40%):模型區分能力一般。
- D > 0.4(40%):模型區分能力優秀。
此外,我們也可以透過顯著性(p值)來檢測D值是否達顯著
2.1 小樣本
在小樣本時,p值可通過KS檢定表查詢,根據兩群體樣本數n1、n2及D值計算p值。
2.2大樣本
在大樣本時(n>30,或者實務上會以更大的樣本去評估),KS統計量近似服從Kolmogorov分佈,p值可通過以下公式近似。
由於統計上的顯著性p會受樣本數影響,因此綜合評估時一般會將D值及p值一起進行考量,以免產生偏誤。
3、實務分析
在進行實務上的分析時,我們一般會透過信用評分卡中邏輯式迴歸(Logistic regression)計算出每個樣本的信用分數(Score),接著我們可以將信用分數作為自變數,客戶情況(好/壞客戶,是否違約)當作依變數,比較兩種不同客戶信用評分的CDF分布情形。這個部分就需要參考我們之前信用評分卡的步驟,會需要有前置的作業。在SPSS中,這個部分要有無母數分析的模組才能進行分析。
以上便是KS檢定(Kolmogorov-Smirnov檢定)在信用評分卡的詳細說明及SPSS模組推薦,若有相關需求都可以與我們聯繫,方便的話再請您給我們一個Google好評,謝謝~


