簡報大綱
• 測驗評量的基本概念
• 歐洲共同語文參考架構(CEFR)介紹
• 華語文能力測驗(TOCFL)介紹
• 試題設計原則
測驗評量的基本概念
• 對外華語測驗與本國語測驗的差別
• 常見的華語測驗種類
• 通過率(P)
• 鑑別度(D)
• 選項誘答力
幾個測驗的基本概念
•對象不同(學習歷程 學習方法 母語…)
•內容不同(語文知識/語言技能)
•考點不同(教學目標)
對外華語測驗和本國語測驗有什麼不同
• 分班測驗 (placement test)
• 成就測驗 (achievement test)
• 能力測驗 (proficiency test)
• 標準參照測驗 (criterion-reference test)
• 常模參照測驗 (norm-reference test)
• 客觀測驗 (objective test)
• 主觀測驗 (subjective test)
常見的華語測驗種類
測驗理論
• 古典測驗理論(Classical Test Theory,CTT)
P = 答對的人數/總人數
• 試題反應理論(Item Respose Theory,IRT)
)
(
)
(
1
i
j
i
j
b
b
ij
e
e
P
• 所有考生在某一試題上答對的比例。
• 根據Language Testing一書的作者Tim McNamara的看法,
好的題目,通過率應介於0.33~0.66間。
• 通過率過低表示題目太難,高能力與低能力的考生都無法
作答。這樣一來不但試題鑑別度降低,也失去了測驗的意
義。
• 通過率太高,則表示,高能力與低能力考生都會作答,同
樣也顯示了試題無區辨性的問題,所以也應盡力避免。
通過率
• 以該份試卷總分前27%的考生與最後27%考生的通過率比
例差。大約可以理解為整體考生中前四分之一和最後四分
之一的差距。
• 鑑別度越高,表示該試題越能區辨出高能力與低能力考生
間的差別。反之,鑑別度越低,表示該試題無法區辨出能
力高下,也因此失去測驗的目的。
鑑別度
• 鑑別度一般的門檻要求為0.2以上。
• 0~0.2的鑑別度一般被視為不佳的表現。
• 如果出現
負的
鑑別度,則表示該試題不但不能適當地呈現
出高能力與低能力考生的差別,甚至出現高能力考生考得
比低能力考生差的情況。可能狀況有兩種:
1. 題目太難,考生都是憑機率猜測,所以才會出現這種反
向的效果。
2. 題目設計可能有問題,造成高能力的學生反而被誤導。
鑑別度
零選答選項
• 一個題目要有良好的鑑別度,除了良好的選
文及題幹外,良好的分心選項也很重要。如
果分心選項完全沒有誘答力,例如一眼就可
看出根本不可能是正確答案,考生就可以用
刪去法找出正確答案—即使他不知道為什麼
這是正確答案!零選答選項就是這種完全沒
有誘答力的選項。
• 數據顯示,零選答選項與低鑑別度有一定程
度的相關,零選答越多,鑑別度越低。
難度、鑑別度與誘答力的關係
• 誘答力越高,難度值降低。
• 誘答力降低時,鑑別度降低。
• 難度值升高時,鑑別度降低。
試題分析
•試題分析解釋步驟如下:
–先看試題鑑別指數及難易度指數。
–如果一題試題難易度指數高,即多數人答
對此題,試題鑑別度指數可能不高,無法
鑑別能力高低,但是一份試卷也需要兩三
題這樣的題目,讓能力差的學生不至於成
績掛零,所以這樣的試題可考慮安置於試
卷的最前面。
試題分析
–再看高分組及低分組選答情形及選項是
否恰當。如果選項誘答錯誤,即引誘高
分組的學生選答,宜考慮修改試題選
項。有些選項無人選答也應該修改。
•
•
•
•
好測驗必備要件
Validity 效度
Reliability 信度
Practicality (feasibility) 可行性
Positive washback 對教學有好影響
– washback: the effect of tests on teaching &
learning
Reliability 信度
• 測驗結果是穩定、一致的
• 不因
– 試題版本
– 考試時間
– 監試者或評分者
而異
Validity 效度
• 一個有效的測驗不該超出欲測的範圍
– 尤其不能同時測驗其他不相干的東西
– 例如:聽力測驗就只能考聽力,不能考作文能
力
• 效度種類
– 表面效度 (face validity),
– 內容效度 (content validity),
– 效標關聯效度 (criterion-related validity)
Practicality 可行性
• 現實上經濟因素的考量,包括金錢、時
間、心力的支出:
– 花費不大
– 容易評分
– 容易出題
– 容易施測
測驗編製流程
決定測驗目標
建立測驗藍圖
選擇適當題型
編製試題
修改(審查)試題
預試
試題分析
建立題庫
歐洲共同語文參考架構
(
The
C
ommon
E
uropean
F
ramework of
R
eference for Languages: Learning, Teaching,
Assessment
)
歐洲共同語文參考架構
The Common European Framework of Reference for Languages:
Learning, Teaching, Assessment
– 歐洲理事會
(The Council of Europe)
– 2001年11月推薦會員國採用
• 歐洲各國
• 智利、墨西哥、哥倫比亞、加拿大
• 澳洲、紐西蘭
• 日本、香港
教學綱要
課程指引
語言測驗
教材編纂
41
CEFR建構緣起
CEFR
語言發
展歷程
學習者
認知
教學
方法
學習者
心理反應
評量
架構
• 歐洲共同語文參考架構(CEFR) :
• 克服
語文專業人士之間
溝通障礙
• 提供一個健全的基礎來
相互認可語文資格
• 促進現代語文領域間之
國際合作
CEFR整體分級表
A1
A2
B1
B2
C1
C2
獨立使用者
精通使用者
初級使用者
• 歐洲共同語文參考架構(CEFR) :
•行動導向及社會導向
• 語言使用者/學習者為
社群份子
:
– 必須在
一定狀況
下、
特殊環境
裡或某些
特
定行為
範疇中,利用
完成特定的
任務
或
議題
。
針對不同的任務,語言學
習者擁有的因應策略。以
正面的形式(can do)來描述
各等級的語言能力
在不同的環境下,面對各
種形式的任務
、議題
語言使用範疇
私人領域
教育領域
職業領域
公眾領域
CEFR編制理念概述
領域
任務
策略
A1
入門級
學習者在對方
發音
十分標準且緩慢
的情況下,
針對
非常熟悉的話題
,能理解與使用
日常用
語
及其熟悉的
詞彙
,以滿足個人的直接需求,
並能以簡單的方式與他人互動。
A1等級整體能力概述
A2等級整體能力描述
A2
基礎級
學習者在對方
發音標準且結構清楚
的情況下,
針對
熟悉的話題
與
例行性事務
,能理解與使
用
簡單句子
及
常用詞
,進行溝通與交換訊息,
並能以簡單詞彙與句子描述
個人
背景、
日常
生活
或喜惡。
B1
進階級
1. 針對將造訪目標語地區的人所制訂
2. 學習者在對方發音標準的情況下,針對
熟悉
話題與常見事物
,能理解其內容並能流利地
進行溝通。能讀懂
熟悉或感興趣
的主題、且
表達直接
的文章要點。
B1等級整體能力描述
B2
高階級
1. 與B1級間存在著語言學習高原期
2. 能聽懂以
標準語
所表達的言談內容,如
交
談、演說
等;能快速瀏覽
長篇的複雜文
本
,並
找出其要點
。具有效的
論證能力
:
在討論中解說並維持其看法、能提供不同
選擇的優劣點、評估替代方案……。在社
交對談中超乎水準地
維持穩定
。
B2等級整體能力描述