發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
以 TOCFL 連結 CEFR 與 ACTFL:標準設定程序的應用
*
藍珮君
1
、陳柏熹
2
、許嘉凌
1
1
國家華語測驗推動工作委員會、
2
國立臺灣師範大學教育心理與輔導學系
緒論
歐 洲 共 同 語 文 參 考 架 構 (Common European Framework of Reference for
Languages;CEFR)與美國外語教學委員會能力指標(ACTFL Proficiency Guidelines;
ACTFL 指標)為國際上兩大主要的語言能力架構。CEFR 係歐洲理事會(Council of
Europe)於 2001 年所公布的指標,除了在歐洲地區廣泛使用,也翻譯為多種語言
版本,如:日語、韓語、俄語等。ACTFL 指標則是由美國外語教學委員會(American
Council on the Teaching of Foreign Languages;ACTFL)於 1986 年提出的指標,此
項指標曾在 1999 年以及 2001 年分別針對口語和寫作能力進行調整,目前最新的
版本為 2012 年版,並在最高等級之上,再增加了優異級(Distinguished),ACTFL
指標目前主要通用於美國地區。
由於不同的編制歷史與文化脈落,兩大語言架構的分級方式也不盡相同,
CEFR 將語言能力分為三等六級(如圖 1),ACTFL 指標則細分為五等十一級(如圖
2),然而,由於能力指標的使用目的皆為測量語言能力的表現,在各個等級也都
描述了語言學習者能夠展現的語言能力或能達成的溝通任務,因此在一些等級的
能力描述中可觀察到二者間有著許多共通的要素。是故,若能進一步建立起
CEFR 與 ACTFL 指標兩大語言架構的對應關係,無論是對語言教學、學習或能
力的評量都將有相當大的助益,也能讓使用兩大架構的美國、歐洲或其他地區產
生更多的交流或合作。
圖 1 CEFR 架構
*
本研究由華測會研究發展組林玲英、曾文璇、孫雪芹、張瑋庭共同完成,特此致謝。
發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
圖 2 ACTFL 指標架構
目前已有一些為數不多的研究探討 CEFR 與 ACTFL 指標等級間的關係,但
僅侷限於口語或寫作能力,尚未有關於聽力或閱讀能力的研究發表(Tschirner,
2005;Buitrago,2006;Martínez,2008;Slagter,Surface & Watson,2010)。此
外,歐洲理事會與 ACTFL 自 2010 年起已連續四年舉辦座談會,共同邀請美國
與歐洲地區的語言專家學者,針對 CEFR 與 ACTFL 指標的內涵及對應關係進行
交流,不過至今仍未發表較為明確的結果。
國家華語測驗推動工作委員會(華測會),長期針對母語非華語之學習者的語
言檢定需求研發華語文能力測驗(Test Of Chinese as Foreign Language,TOCFL)
的,同樣意識到此一議題的重要性,因此華測會先於 2008 年起參考 CEFR 內容
對 TOCFL 測驗題型及架構進行調整,並在 2012 至 2013 年進行標準設定研究,
制定出 TOCFL 聽力測驗與閱讀測驗入門級、基礎級、進階級、高階級、流利級
與精通級門檻,完整地將測驗等級對應至 CEFR 的 A1 至 C2 六個等級(藍珮君、
陳柏熹、林玲英、李嘉真、孫雪芹、曾文璇,2013)。接著,為了讓使用 ACTFL
指標的美國地區學習者也能夠有所參照,華測會再於 2014 年進行 TOCFL 聽力
測驗、閱讀測驗對應至 ACTFL 指標的標準設定研究,目的在制定 TOCFL 聽力
與閱讀測驗對應至 ACTFL 指標各級的通過門檻,同時也希望藉由 TOCFL 測驗,
為 CEFR 與 ACTFL 指標搭起橋樑,完成兩大語言架構等級間的對應。因篇幅有
限,本研究僅先針對 TOCFL 聽力測驗進行說明。
研究方法
本研究程序為採用 Bookmark 法(Lewis, Miztel, & Green, 1996)進行標準設定
研究,制定 TOCFL 聽力測驗對應至 ACTFL 指標各級的通過門檻能力值,再與
已完成的 CEFR 各級通過門檻能力值進行對照。進行標準設定的首要步驟,是確
定通過等級的個數並制定各等級的表現水準描述(performance level description,
發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
PLD),PLD 通常是針對最低能力受測者(minimally competent examinee)的能力進
行描述,若測驗結果要區分為數個等級,則需制定數個 PLD。先前已提到 ACTFL
指標分級較細,共涵蓋十一個等級,且在初級(Novice)、中級(Intermediate)和高
級(Advanced)三等中又再細分出初等(Low)、中等(Mid)以及高等(High)三個次級,
考量 ACTFL 指標十一個等級描述的內容,在實際操作上不易再制訂出最低能力
受測者的描述,故研究者與測驗專家討論後,在這次研究中調整 Bookmark 法的
操作方式。
Bookmark 法原始的進行方式是請判斷成員從一份將試題難度由易至難排列
完成的測驗卷中(ordered item booklet,OIB),依照最低能力描述,標記出符合該
能力描述的學習者,答對機率為 67%(RP67)的試題,再依據已知的試題難度參數
計算出能力值,並以該能力值做為通過門檻。在本研究中,將 ACTFL 指標的各
級能力描述視為典型能力描述,成員改為依照各等級的典型能力描述標記出
RP67 的試題,再依據難度參數計算出典型學習者之能力值,而各等級的通過門
檻設定為相鄰二等級典型學習者能力值的中間數。如:以優秀級(Superior)和優
異級(Distinguished)的典型能力描述分別標記出 RP67 的試題,計算出能力值後,
其中間值即為優異級的通過門檻。
本研究於 2014 年 6 月邀請華語教學相關領域學者與資深華語教師共 10 人參
與為期二天的研究,第一天首先介紹標準設定流程與 Bookmark 法的操作方式,
說明 ACTFL 指標聽力部分的能力描述,以及簡介 TOCFL 聽力測驗的題型,讓
與會成員先行熟悉標準設定作法以及了解能力描述內容。接著,發下聽力測驗題
本,請與會成員依據 ACTFL 指標的描述,獨自標記初級初等(Novice Low)至中
級高等(Intermediate High)六個較低等級答對機率為 67%的六道試題,並寫下判斷
理由。標準設定題本的組成以題庫難度分布為依歸,以 0.5 logit 為區間進行挑題,
每個區間大約各 10 題,共 179 題。在成員完成第一回合判斷後,研究者統整並
說明判斷結果,說明中提供的資料包括各等級每位成員標記的試題編號與對應之
能力值、各等級能力值的平均數、中位數、最大值與最小值,以及依照 2013 年
應試者能力值,得出各等級暫定門檻的累積通過比率。研究者帶領成員討論並分
享每一等級的判斷依據,待與會成員皆陳述意見後,再各自進行第二回合的判斷,
並填寫會議問卷,回收相關文件資料,結束第一天的議程。
第二天研究者先告知成員前一天第二回合六個等級的判斷結果,再發下題本
與 ACTFL 指標 能力 描述文 件, 繼 續進 行 高級初 等 (Advanced Low)至 優異
(Distinguished)五個較高等級的題號標記,程序與第一天相同,共進行二個回合。
完成 TOCFL 聽力測驗與 ACTFL 指標等級的對應後,研究者彙整 TOCFL 聽力測
驗在 CEFR 各等級通過門檻的能力值,比對出 CEFR 與 ACTFL 指標等級之間的
關係。
發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
研究結果
(一)TOCFL 對應至 ACTFL 指標的效度證據
Kane(1994) 提 出 可 從 程 序 性 效 度 (procedural validity) 、 內 部 效 度 (internal
validity)與外部效度(external validity)三方面檢核標準設定研究的結果,本研究
TOCFL 對應至 ACTFL 指標的標準設定過程,均依照既定的步驟進行,判斷後成
員之間亦進行充分的討論與分享,交換判斷理由與依據,回收問卷調查結果顯示
成員了解標準設定流程與 Bookmark 法進行方式,且了解 ACTFL 指標各等級能
力描述的意涵等研究進行所要求的相關資訊,以上皆顯示標準設定結果具有程序
性效度。而觀察第一回合與第二回合的各等級判斷結果後,可發現十一個等級在
第二回合的標準差均小於第一回合,表示經過討論後,成員間的判斷趨於一致,
可做為標準設定結果的內部效度證據。
(二)CEFR 與 ACTFL 指標的對應關係
研究者整理 TOCFL 分別與 CEFR 和 ACTFL 指標各等級對應的能力值,連
結兩者等級間的關係,結果如圖 3 所示,數值部分因涉及測驗機密,故僅提供相
對應關係之示意圖;而初級初等(Novice Low)由於 OIB 題本中通過門檻能力值附
近的試題過少,研究者認為無法對此一等級作準確的判斷,因此初級初等的結果
不納入對照。由圖 3 可知,CEFR 的精通級(C2)略低於 ACTFL 指標的優異級
(Distinguished),而流利級(C1)介於優秀級(Superior)和高級高等(Advanced- High)
之間,高階級(B2)在高級高等(Advanced- High)和高級中等(Advanced- Mid)之間,
進階級(B1)與基礎級(A2)分別相當於中級高等(Intermediate- High)、中級中等
(Intermediate- Mid) , 而 入 門 級 (A1) 介 於 初 級 高 等 (Novice-High) 與 初 級 中 等
(Novice- Mid)之間。
發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
圖 3 CEFR 與 ACTFL 指標對應結果
討論與建議
本研究先以標準設定方式,採用 Bookmark 法將 TOCFL 聽力測驗對應至
ACTFL 指標,制定出各等級通過門檻,並提出程序性效度與內部效度證據,以
支持此一對應結果的有效性。接著,再與 2013 年完成的 TOCFL 聽力測驗與 CEFR
等級的對應結果做比較,可說是透過二次 TOCFL 聽力測驗的標準設定程序,建
立起國際上二大語言架構的對應關係。過去針對兩大架構的對應研究主要多為比
較考生測驗成績與自評問卷的結果,或是就指標描述內容進行對應,本研究首創
利用標準設定程序進行語言架構關係的連結,此一方法運用了實徵的測驗資料以
及成員的專業判斷,所獲得的結果較為客觀可靠,可提供未來相關研究做為參考。
此外,本研究結果提供外界 CEFR 與 ACTFL 指標在聽力部份的等級對照參考,
可讓參加 TOCFL 的應試者,除了得知自己 CEFR 等級外,也能了解自身語言程
度相當於 ACTFL 指標的等級,讓測驗結果發揮更多的用途,為本研究結果的重
要貢獻。
關鍵字:ACTFL、CEFR、TOCFL、標準設定
Novice- mid
Advanced- Mid
Intermediate- mid
Intermediate- low
Distinguishe
d
Superior
Advanced- High
Advanced- Low
Intermediate- high
Novice- high
C2
C1
B2
B1
A2
A1
CEFR
ACTFL 指標
發表於 2014 年第三屆標準本位評量國際研討會,國立台灣師範大學,2014 年 10 月 2-3 日
參考文獻
Baztán, Alfonso Martínez (2008). La evaluación oral: una equivalencia entre las
guidelines de ACTFL y algunas escalas del MCER (doctoral thesis). Universidad
de Granada. ISBN 978-84-338-4961-8.
Council of Europe. (2001). Common European Framework of Reference for
Languages: learning, teaching, assessment (chap.1 & chap.4). Retrieved January
17, 2007, from http://www.coe.int/t/dg4/linguistic/Source/Framework_EN.pdf
Council of Europe. (n. d.). Language versions. Retrieved August 13, 2007, from
http://www.coe.int/t/dg4/linguistic/Source/List_Cadre_traduc.doc
Kane, M. (1994). Validating the performance standards associated with passing
scores. Review of Educational Research, 64, 425–461.
Lewis, D. M., Mitzel, H.C., & Green, D. R. (1996). Standard setting: A bookmark
approach. Paper presented at the Council of Chief State School Officers National
Conference on Large Scale Assessment, Boulder, CO.
藍珮君、陳柏熹、林玲英、李嘉真、孫雪芹、曾文璇(2013)。Yes/No Angoff 法在
華語文聽力測驗與閱讀測驗的應用,中國測驗學會 2013 年會暨心理與教育
測驗學術研討會,臺灣台中。