所謂的C指數(C-index),即為一致性指數(index of concordance),是用來評估模型的預測能力,即預測結果與實際結果相一致的比例,有點類似於ROC曲線下的面積。
ROC曲線法(ROC curve) 相關說明可參考:
http://www.yongxi-stat.com/receiver-operating-characteristic-roc/
以R軟體計算羅吉斯迴歸的C統計量(C Statistic) 相關說明可參考:
http://www.yongxi-stat.com/c-statistic/
以醫學領域臨床病患生存時間觀察為例,其計算方法是將所有的病患隨機兩兩配對,如果生存時間較長的病患,其根據模型預測生存時間長於另一位生存時間較短的病患;或是生存機率高於另一位生存機率較低的病患,則稱之為預測結果與實際結果相一致。
一、C指數(C-index)計算步驟
(一) 產生所有的兩兩病例配對。
(二) 排除下列兩種情形:配對中觀察時間較少的病例沒有達到觀察終點;配對中,兩項病例均未達觀察終點,其餘則為有效配對樣本。
(三) 計算有效樣本中,預測結果與實際結果相一致的配對樣本數,即具有較壞預測結果的病例其實際觀察時間較短。
(四) C指數=一致配對樣本/有效配對樣本。
由上述計算方法可得出,C指數應介於0.5至1之間,而0.5為完全隨機,說明模型沒有預測效果,1則為完全一致,說明模型預測結果與實際結果完全一致。
在實證研究中,很少有完全一致的模型,因此過去的研究多認為C指數在0.50至0.70之間為較低準確度;0.71至0.90之間為中等準確度;高於0.90則為高準確度。
二、使用R計算C指數(C-index)的步驟
(一) 首先大家可自行安裝R軟體,建議可以安裝操作介面較為友善的R studio免費版。
(二) 接著點擊右下角Packages中的Install,並安裝「Hmisc」、「survival」等套件。
(三) 安裝完成後,以「Library()」指令呼叫上述套件。
(四) 接著匯入所欲分析的檔案。
(五) 使用「coxph ()」函數進行cox迴歸:
fit <- coxph(Surv(time,plate_exposure)~Postop_radiation + ALT_M + Chimeric, data=final_data1104)
(六) 使用剛剛安裝好的套件計算C指數,即可出現統計報表。
sum.surv <- summary(fit)
c_index <-sum.surv
c_index
(七)報表中的Concordance即為C指數(C-index)。