一般的測驗評量方式,是透過受試者在測驗的每道題目中作答的總分加總,以作為該測驗的總得分,可被當做連續變數所使用,若分數越高,則代表程度越好

 

然而,這樣的評量方式,只能區分出分數的高低,且分數間的差異性只是相對的概念,而並非絕對的概念(如60分比55分多5分,100分比95分多5分,但兩者的涵義與受試者的能力均不相同)。以及若整體題目偏難或偏易,則受試者得分的高低也不能真正代表其程度。

 

上述困難是因為分析者在進行比較時沒有固定的參照點,因此若要真正比較分析受試者的程度,則需要提供一個固定的參照點,而這也是Rasch Model設計的理論依據。

 

Rasch Model是由丹麥數學家Georg Rasch(1960)提出用來評估智力與成就的測量模型。該理論透過對數勝算比(Log Odds)的概念,分析每道題目所有受試者的整體回應來評估該道題目之難度,同時藉由填答者在整份問卷的表現狀況來估算其個人能力水準。

 

換言之,若大部分人未答對該題,即代表該題本身難度較大,若某人答對困難的題目越多,則表示其相對能力較高,並可將受試者的能力估計值與試題的難度估計值繪製在同一張圖表中,如下圖所示。

資料來源:余民寧(2020)。

 

因此,Rasch Model之評分方式所具有的優點如下:

1.單一維度性:所有的分數都能在同一座標上進行比較。

2.局部獨立性:當影響測驗表現的能力固定不變時,受試者對於任一試題上的反應,在統計學上都是獨立的。

3.可複製性:該模型具有數學理論基礎,可排除研究者主觀給分所造成的差異。

4.可驗證性:該模型可針對模型的適配度進行統計探討,並可提供對應之指標。

 

由於Rasch Model背後有其複雜的數學理論基礎,目前常被用於醫學統計及教育評量的統計中,也發展出許多統計軟體供大家操作使用。其中,可用於Rasch分析的軟體如下:

1.Winsteps

下列網址提供了免費簡易版本,僅能分析25道試題與75名受試者,而完整版本可分析6萬道試題與1千萬名受試者。

https://www.winsteps.com/ministep.htm

2.RUMM2020

3.QUEST and ConQuest

4.Facets

5.CADATS

資料來源:余民寧(2020)。量表編製與發展-Rasch測量模型的應用。新北市:心理出版社。