電腦化S-P表在英語教學評量中的應用

電腦化S-P表於英語教學評量之運用

摘要：

　　本研究要旨在突破紙筆測驗，只重打分數、排名次，以考試成績的「量的評定」，而忽略「質的分析與診斷」。因此，透過電腦化S-P表分析紙筆英語教學評量結果，以量化指標，判斷試題編製的良窳、改進命題與教學的參考及學習輔導的依據。

　　在教學歷程中，以教學評量活動評定學生的學習成果，可達三項目的：1.教學前的安置性評量－了解起點行為及適當安置學生。2.教學中的形成性、診斷性評量－確認適當教學活動及調整教學步調；診斷學習困難及激勵學習動機。3.教學後的總結性評量－明瞭學習成果及評定成績等定。在日常考查評量中，教師自編成就測驗卷適合教學對象否？符合教學目標否？在評定教學成效達成與否，先行檢視測驗試題品質，如此測驗評量結果呈現的資料才有實際的作用。教學評量在紙筆測驗的方法下，不重在獲悉評量的結果，而應在深入思考「為何要評量」的問題（Kohn, 1994）。利用評分標準客觀且方便獲得大量資料的紙筆測驗數據，本研究的目的：一、利用電腦程式軟體，建立S-P表，進行測驗分析，以量化指標，提供以下功能：1.診斷學習困難，實施個別輔導。2.，確認教學缺失，調整教學策略。3.判定並修改試題的參考。二、運用S-P表於英語學習評量，提昇教學成效。

關鍵詞：S-P表(student-problem score table)
教師自編成就測驗(teacher-made achievement test)
學習成效(learning performance)

紙筆測驗(paper-and-pencil test)

壹、緒論

在學校內師生共同參與的活動歷程中，教師的任務在於運用各種教學方法，引導學生的學習行為，邁向既定的教學目標。根據教學模式雛形（Glaser, 1962）在此整個有系統的教學歷程中，包括四大部分：教學目標、起點行為、教學活動和教學評量。其中教學評量與其它各部分均有密切關係。在教學過程的前、中、後，只有靠教學評量活動以評定學生的學習成果，以達三項目的：

教學前的安置性評量－了解起點行為及適當安置學生。
教學中的形成性評量－確認適當教學活動及調整教學步調。診斷性評量－診斷學習困難及激勵學習動機。
教學後的總結性評量－明瞭學習成果及評定學業成績等定。

　　在教室內的教學活動中，教師如何得知教學是否有效？學生的學習是否有困難？若有學習困難產生，此困難是肇因於教師的教學？還是學生的學習？這一切都離不開教學評量的分析和解釋。

　　教學是師生共同參與相互影響的歷程。教學評量在教學過程中扮演相當重要的角色。大至聯考的評量與計分方式，小至教師自編成就測驗的鑑別度，都成為社會大眾、家長及教師關注的焦點。現今很多的教育改革，常利用改變評量的方式來推動，即透過「評量引導教學」，例如：國中基本學力測驗、大學入學的推薦甄試等。此一「以工具取代本質」錯誤的觀念，一直誤導教師的教學。測驗評量應只是教學歷程中的診斷工具，而非引導教學內容，影響教學目標。

　　教師應利用評量的結果，來檢視和獲致學生的學習成果及教師本身的教學成效等相關訊息，並利用這些訊息來幫助學生克服學習困難、激發學習潛能，以及協助教師調整教學，以達有效的教學。對於目前主要的評量方式－傳統的紙筆測驗，雖然有許多為人所詬病之處，但在大班教學及「公平客觀原則」下，仍為評量方式的主流。教師如何利用紙筆測驗的結果，發揮教學評量的功能，以達有效的教學，是本研究的主要動機。

研究者身為英語教學者，在用心的教學後，對於每次的測驗評量，皆抱著相當大的期待。希望藉著測驗的結果，由學生的學習成果獲得回饋，以及印証自己教學的適當性。但是，測驗的分數卻經常出現相當的預期落差，這不禁讓研究者感到納悶，到底是本身的教學出了問題；還是學生的學習有了盲點；抑或試題的編製產生偏差。這種種的疑問，實無法從測驗表面的分數獲得解答，故需針對紙筆測驗的結果，進行量化分析，以獲得指標性的指數，轉化成所欲的資訊，發揮評量的真正效能。

一、S-P表分析理論

　　因為測驗結果，得分相同的學生，其學習能力與學習成就可能不同，於是教師應診斷學生學習類型，施予不同的補救教學方法，以達學習目標。Harnisch和Linn(1981)為診斷學生學習情況，決定個別輔導內容，推出一種數值量化的測驗圖解解析方法，稱為學生－問題表（Student-Problem Chart），簡稱S-P表，由此可看出全班及個別學生對整份測驗及個別試題的成就水準及其趨勢；教師的教與學生的學的相關性，每個學生的成就樣式、學習型態及穩定度。以下就一S-P表的基本概念、(二)S-P表的功能、(三)S-P表的判讀要點，分別加以說明(余民寧，民86；呂文秋(1987)；Sato，T.(1975) (1985))。

　　傳統的學習成就評量，對於測試的結果，教師處理方式，只計算並比較學生得分及全班平均，並從學生得分在分數分布曲線的位置，比較判斷其學習成就。如此尚難達到瞭解學生學習，診斷學習困難，改進教學內容，從事補救教學的評量目的。

　　(一)、S-P表的基本概念

　　所謂S-P表，是指學生的考試分數與試題的答題情形的一覽表。而S-P表分析，乃是為了解學生的學習狀況，判斷試題是否適當，以供進一步學習診斷之用，根據學生作答情況，予以有系統的重排而加以分析。教學後的評量除評定分數、排列名次外，為做更積極、徹底的應用，以掌握個別學生的學習情況，並發現適應不良的學習及不當的命題，診斷其學習困難而作為補救教學或學習輔導之依據。利用探究試卷的答題情況分析出學生的學習狀況與試題的適當否。

　　根據學生與試題得分，加以重新排列。S-P 表縱座標是依學生得分的高低依序排列，高分者排列在下，低分者排列在下；橫座標依試題的難易順序排列，左邊是答對率高的試題，右邊是答對率低的試題。如此，將學生與試題得分，重排並圖表化的縱橫一覽表，教師可快速診斷出學生的學習困難與成就情形，和試題的適當與否。

　　(二)、S-P表的功能

　　目前普遍實施於中小學的常模參照測驗，偏重於考試得分的相對記敘，欠缺評量的回饋和學習診斷功能。Bloom(1971)曾提出三種型態的學習評量：1.診斷性評量（Diagnostic Evaluation）：探知學習前的先備條件並預測學習中可能發生挫敗的因素。2.形成性評量（Formative Evaluation）：獲得學習過程中的回饋資料，以期了解並控制學習，改進教學策略。3.綜合性評量（Summative Evaluation）：評定學習成效，以改進課程及教學計劃。S-P表不但可使用於學習前的診斷評量，而且在形成性評量中更能充分發揮其效用，甚至在總結性評量時也能完全應用。依據佐藤隆博實證研究指出，S-P表在教學評量上的功用，計有下列五項（陳騰祥，民75）：

1.S-P表的處理與分析手續簡易，凡是教師，人人可做。

2.S-P表的研判與讀出，一目了然，不僅可掌握全班情況，也能作個別學生和個別試題的判讀。

3.S-P表的功用，就學習診斷上，可作「量的分析」也能作「質的分析」，其功用既切實又廣泛。

4.S-P表分析的結果，對教學、輔導及發問等是否適宜，均能提供改進的資料或線索。

5.S-P表分析不僅可用於平時測驗結果的分析、試題分析，而且對習題、前測（pre-test）、後測（post-test）等的分析，亦有很大功用。

　　(三)、S-P表判讀的要點

　　S-P表分析時，根據S、P曲線的形狀和位置，及S曲線和P曲線相分離的程度，以及差異係數和注意係數，其判讀要點如下：

1.S曲線的判讀：因為S曲線是表示學生答對題數的分配情形。S曲線左上方的面積愈大，學生的達成度（答對率）愈高。

2. P曲線的判讀：因為P曲線是表示試題答對人數的分配情形，也就是表示各題答對率的分配。

3.S、P曲線相分離的判讀：依測驗科目、內容、種類及方式的差異，S、P曲線相分離的判讀標準就不同。但如果是學業成就測驗的S、P曲線分離過大，必須進一步探討其原因，計有下列九項（佐藤隆博，1980）。

　(1)教學不清楚，未達精通的地步。

　(2)測驗內容之命題取樣不符教學內容。

(3)命題之題目排列順序，甚至試題內容的表達、敘述或提示失當。

(4)學生學習未達精熟的程度。

(5)教學與測驗時日相隔太久。

(6)中等或低劣程度的學生，其學習呈不穩定的現象。

(7)學生的學習意願或動機低下。

(8)學生的心理或生理現象發生較大的變化。

(9)教師的評分標準不一、重點不明，甚至評分錯誤或誤解。

4.差異係數的判讀：根據差異係數做判讀的參考標準如下，

綜合測驗　D*=0.5　標準　D*＞0.6　要注意

平時測驗　D*=0.4　標準　D*＞0.5　要檢討

5.注意係數的判讀：注意係數是指實際反應組型與完全反應組型相差之值，從S-P表求出學生或試題注意係數，其判讀標準如下，

　(1)學生的注意係數的判讀標準→診斷學生的學習狀況及學習類型

A　　　　　A'

學習有效　不注意的過失

B　　　　　B'

學習不足　學習不確定

要努力　　學習準備不足

0.5 1.0

滿分

學生的得分合計

注意係數與得分的對照

（得分高，但Cs＞1.0可視為特殊反應組型）

A　　　　　　A'

學習有效　　粗心大意

穩定性高　造成錯誤

B　　　　　　B'

學習尚穩定　　學習準備不足

需要再用功　　需再努力

C　　　　　　C'

學力不足，學　學習極不穩定

習不忌分，需　，隨興讀書

更加努力　　　對考試內容無

　　　　　　　充分準備

0.5 1.0

滿分

學生的答對得分

利用係數與得分診斷

(2)試題的注意係數的判讀標準→診斷試題的良窳

A　　　　　　　A'

試題適當可區　　試題含異質成

別低成就者與　　份需局部修正

他人的不同　　　試題難度低且

試題難度低且　　差異性大，應

差異性小　　　　檢討命題

B　　　　　　　B'

試題難度高適　　試題拙劣且含

合區別高成就　　相當異質成分

者　　　　　　　需加以修改

試題難度適當　　試題難度適當

且差異性小　　　但差異性大

　　　C C'

試題難度高且　　試題難度高且

差異性小，適　　差異性大，應

合區別高成就　　檢討命題

者

　　　　　　0.5 1.0

100%

試題答對率

85%

40%

試題注意係數

四、S-P表分析的應用

　　教學評量影響整個教學歷程，它可給予教師和學生回饋，提供改進教學和學習的具體幫助。而在進行教學評量時，利用教師自編測驗做為評量工具時，依照學生在試題上的反應資料以S-P表進行分析，以獲得該試題的差異係數、學生和試題的注意係數，然後綜合研判該測驗試題的品質，難度、鑑別度是否適當？那些試題應予注意或特別注意，而需要進一步修改者？那些學生的學習已趨穩定？那些學生需要接受個別輔導或補救教學？這些根據S-P表分析研判的訊息可提供教師和學生做為改進教學和命題技術，以及學習診斷的參考，進而有效地達成教學目標。

(一)、可用於教學各階段的學習評量：根據研究證實得知，S-P表分析可用在各種測驗及各階段的學習評量。舉凡標準化學業成就測驗，定期學期考試、單元測驗、隨堂測驗，甚至綜合性評量，形成性評量，學前評量皆可適用。不過，S-P表分析的特點，透過量化指標注重「質的分析」，因此，對效標參照的絕對評量，較為適宜。

(二)、建立有效活用教學管理系統：一般而言，教學的主要過程，包括「教學設計」、「教學實施」、「教學評量」等，其中，教學評量的過程運用S-P表分析，不但可了解學生的學習成就狀況，而且能找出診斷學生及檢討試題的線索，進而又可供教學設計與教學實施等改進的依據，如此建立有效的教學管理系統，促使教學精緻化和現代化。茲將教學管理流程圖示如下：

˙改進後再設計

教學設計

（目標）

教學評量

教學實施

˙分析資料

˙評量學習結果及過程

˙診斷學生的學習

˙檢討試題的得失

˙電腦在教學上的使用，

可促進教學的實施

(三)、早期發現學習適應不佳的學生：從S-P表分析找出注意係數大於0.5的學生，了解是否有學習適應不佳的情形，然後進一步研判其原因，以便於對症輔導。

(四)、教師自我檢討教學策略的得失：從S-P表分析的差異係數大於0.5的標準，配合其他相關因素，對教師自己的教學成效，提供可靠確實的資料，以利自我檢討教學的設計、實施、策略等，有效改進教師的教學。

肆、研究結果與討論

一、教學評量實施程序與定位

本研究以國立瑞芳高工綜合高中部一年丁班學生33人為對象，對遠東高中英文第一冊第一課「Learrning English Can Be Fun」進行實際教學，然後，實施二次形成性評量測驗和一次總結性評量測驗，蒐集S-P表相關測驗分析資料。運用電腦評閱三次測驗結果並選擇軟體程式處理資料，作成檔案，印製出S-P表並計算個別學生和試題的注意係數。最後，由S-P曲線圖形看出全班同學學習之達成水準及傾向；利用學生的得分率與注意係數（Cs）為評量參數，了解學生的學習行為及回答問題的學習穩定度以為補救教學或個別指導的依據；利用試題的答對率與注意係數（Cp）為參數，診斷試題的良窳，以檢討、修正試題。同時，看出教師之指導與學生學習間的聯結程度，以利教師對教材組織結構與教學方式進行檢討，以達成有效教學。

二．S-P表的讀取評量結果

利用學生得分的累加分佈的S曲線圖和試題答對學生人數累加分佈的P曲線。探討S和P曲線的位置和形狀，可獲取有用的測驗和評量結果。根據S曲線的位置，可看出學生的學習成就達成水準，而S曲線的形狀，可了解學生得分的分佈情形；同時，依照P曲線的位置，可看出每個試題的答對率，而從P曲線的形狀，可了解學生對於各個試題的分數分佈狀況。另外，利用S-P表分析學生的學習狀態時，對於學習不穩定的學生，宜針對其所答錯之試題內容和答錯各問題之間是否有共通點來加以分析，診斷，以便實施補救教學。再者，S曲線左方之「０」代表答錯問題情形，多半出於學生練習不充分，學習不努力或理解不徹底，作答不細心所致，可經由教學引導，加以改善；惟S曲線右方的「０」代表錯誤情形，屬於基本理解都不懂或隨手亂寫故需先補強學生先備知識，才能進行教學。

三、S-P表的結果與討論

綜一丁第一次形成性評量

學生S表

座號	答對題數	答對率(%)	注意係數	偏差值	學生診斷分析
1	28	84.8	0.15	72.5	A　　學習穩定
6	26	78.8	0.30	68.1	A　　學習穩定
18	23	69.7	0.19	61.5	A　　學習穩定
19	23	69.7	0.21	61.5	A　　學習穩定
8	23	69.7	0.29	61.5	A　　學習穩定
11	23	69.7	0.41	61.5	A　　學習穩定
2	22	66.7	0.25	59.3	B 標準
3	21	63.6	0.37	57.1	B 標準
24	20	60.6	0.12	54.9	B 標準
31	20	60.6	0.13	54.9	B 標準
10	20	60.6	0.19	54.9	B 標準
22	20	60.6	0.30	54.9	B 標準
29	19	57.6	0.25	52.7	B 標準
23	19	57.6	0.26	52.7	B 標準
15	19	57.6	0.28	52.7	B 標準
5	18	54.5	0.16	50.5	B 標準
27	18	54.5	0.23	50.5	B 標準
17	18	54.5	0.36	50.5	B 標準
30	16	48.5	0.16	46.1	B 標準
9	16	48.5	0.20	46.1	B 標準
21	16	48.5	0.21	46.1	B 標準
33	16	48.5	0.26	46.1	B 標準
32	16	48.5	0.27	46.1	B 標準
28	15	45.5	0.26	43.8	B 標準
4	15	45.5	0.31	43.8	B 標準
14	15	45.5	0.37	43.8	B 標準
25	14	42.4	0.19	41.6	B 標準
20	14	42.4	0.19	41.6	B 標準
7	14	42.4	0.24	41.6	B 標準
26	13	39.4	0.09	39.4	C 學力不足
12	11	33.3	0.41	35.0	C 學力不足
13	9	27.3	0.37	30.6	C 學力不足
16	7	21.2	0.25	26.2	C 學力不足

　　第一次形成性評量學生回答問題的注意係數（Cs）皆小於0.5，表示各個學生的反應組型，發生不尋常的情況並不嚴重，還在容許的作答誤差範圍內。進一步探究同分組同學（如18.19.8.11號）尤其是18號和11號，為何注意係數不同（0.19、0.41），以了解同分組學生為何會答錯一般同學認為較簡單的問題而答對一般同學認為是較困難的問題及其間的差異以診斷個別學生的學習問題所在。再者，根據學生學習行為診斷分析來看，一般學生的學習尚穩定，惟有少數學生（26.12.13.16號），對此學習單元學力不足，有待進行補救教學。

綜一丁第一次形成性評量

問題P表

一般答對率(%) 上限85%~下限40%
題號	答對人數	答對率(%)	試題注意係數	試題診斷分析
22	32	97.0	0.19	A 容易
26	29	87.9	0.22	A 容易
32	27	81.8	0.21	B 適當
07	26	78.8	0.13	B 適當
17	26	78.8	0.29	B 適當
25	25	78.8	0.97	B 適當
19	23	69.7	0.20	B 適當
29	23	69.7	0.44	B 適當
30	22	66.7	0.14	B 適當
28	22	66.7	0.29	B 適當
20	21	63.6	0.35	B 適當
31	21	63.6	0.38	B 適當
16	21	63.6	0.44	B 適當
21	19	57.6	0.13	B 適當
12	19	57.6	0.31	B 適當
23	17	51.5	0.18	B 適當
09	17	51.5	0.26	B 適當
14	17	51.5	0.59＊	B'試題難度適當但含異質性
01	16	48.5	0.33	B 適當
08	16	48.5	0.42	B 適當
04	15	45.5	0.47	B 適當
13	14	42.4	0.20	B 適當
24	14	42.4	0.29	B 適當
10	14	42.4	0.34	B 適當
02	13	39.4	0.19	C 困難
27	11	33.3	0.21	C 困難
33	11	33.3	0.29	C 困難
05	11	33.3	0.47	C 困難
18	10	30.3	0.19	C 困難
11	10	30.3	0.19	C 困難
06	9	27.3	0.40	C 困難
15	8	24.2	0.22	C 困難
03	8	24.2	0.35	C 困難

　　第一次形成評量性評量試題的注意係數（Cp）可看出命題品質，除第14題的Cp>0.5，顯示該試題含有異質成份或編製不良，應加修改。但就整體而言，整份試卷的試題尚稱適當。惟其中約1/4的試題對該班學生而言，難度偏高，平均答對率約50%，顯示教學成效有待提升。

綜一丁第一次形成性評量的S-P曲線圖

S曲線P曲線

1 2

7 5

1 2

9 9

3 2

0 8

2 3

0 1

1 2

6 1

1 2

2 3

0 1

9 4

0 0

1 8

0 1

4 3

2 1

4 0

0 2

2 7

3 0

3 5

1 1

8 1

0 1

6 5

答對題數

答對率(%)

2 2

7 6

2 2

6 5

2 2

3 3

2 2

1 1

2 1

1 9

1 1

9 7

1 1

7 7

1 1

7 6

1 1

6 5

1 1

4 4

1 1

4 3

1 1

0 0

9 8

答對人數

3 2

2 9

　　經由S-P表曲線圖分析顯示，從S曲線或P曲線之位置可以看出學生平均答對率約50％。從P曲線之形狀可看出試題之答對率約在21％至85％之間。再者，S曲線圖呈現S字型，可看出得分率50%的學生佔相當多數，靠近滿分或零分的學生人數相當少。其類型可歸於一般標準學力測驗的模型。

根據S表曲線作出和相對應的成績分佈後的直方圖，可看出此次評量結果呈現常態分佈。

綜一丁第二次形成性評量

學生S表

座號	答對題數	答對率(%)	注意係數	偏差值	學生診斷分析
1	29	87.9	0.13	73.5	A　學習穩定
18	26	78.8	0.11	67.5	A　學習穩定
8	26	78.8	0.15	67.5	A　學習穩定
3	25	75.8	0.27	67.5	A　學習穩定
21	22	66.7	0.19	59.6	B 標準
15	22	66.7	0.26	59.6	B 標準
10	21	63.6	0.20	57.6	B 標準
19	21	63.6	0.22	57.6	B 標準
11	20	60.6	0.26	55.6	B 標準
31	19	57.6	0.15	53.6	B 標準
24	19	57.6	0.19	53.6	B 標準
23	19	57.6	0.22	53.6	B 標準
29	18	54.5	0.09	51.6	B 標準
5	18	54.5	0.21	51.6	B 標準
33	18	54.5	0.41	51.6	B 標準
20	17	51.5	0.18	49.6	B 標準
6	17	51.5	0.28	49.6	B 標準
27	16	48.5	0.04	47.7	B 標準
17	16	48.5	0.16	47.7	B 標準
30	16	48.5	0.19	47.7	B 標準
2	16	48.5	0.23	47.7	B 標準
4	16	48.5	0.26	47.7	B 標準
16	15	45.5	0.32	45.7	B 標準
26	14	42.4	0.14	43.7	B 標準
22	14	42.4	0.33	43.7	B 標準
7	13	39.4	0.24	41.7	B 標準
28	13	39.4	0.29	41.7	B 標準
14	12	36.4	0.20	39.7	C 學力不足
25	11	33.3	0.21	37.7	C 學力不足
12	11	33.3	0.25	37.7	C 學力不足
9	11	33.3	0.32	37.7	C 學力不足
32	10	30.3	0.35	35.7	C 學力不足
13	6	18.2	0.37	27.8	C 學力不足

第二次形成性評量學生回答問題的注意係數（Cs）皆小於O.S，表示各個學生的反應組型，發生不尋常的情況並不嚴重，還在容許的作答誤差範圍內。進一步探究同分組同學（如27.17.30.2.4號）其個別作答反應差異的原因，診斷個別學生的學習盲點。再者，由學生學習行為的診斷分析可知，一般學生的學習尚穩定，尤其1.18.8.3號學生的學習，不但有效且穩定，但少數學生（14.25.12.9.32.13號）對此學習單元學力不足，有待進行補救教學。

綜一丁第二次形成性評量

問題P表

一般答對率(%) 上限85%~下限40%
題號	答對人數	答對率(%)	試題注意係數	試題診斷分析
07	30	90.9	0.09	A 容易
05	28	84.8	0.23	B 適當
10	26	78.8	0.14	B 適當
19	24	72.7	0.50＊	B'試題難度適當但含異質性
12	23	69.7	0.10	B 適當
06	22	66.7	0.17	B 適當
16	21	63.6	0.07	B 適當
22	21	63.6	0.13	B 適當
02	21	63.6	0.24	B 適當
01	21	63.6	0.38	B 適當
29	19	57.6	0.18	B 適當
28	19	57.6	0.26	B 適當
27	18	54.5	0.16	B 適當
18	18	54.5	0.22	B 適當
20	18	54.5	0.28	B 適當
30	18	54.5	0.34	B 適當
15	18	54.5	0.38	B 適當
11	18	54.5	0.41	B 適當
03	18	54.5	0.41	B 適當
13	17	51.5	0.25	B 適當
14	17	51.5	0.25	B 適當
09	17	51.5	0.36	B 適當
25	15	45.5	0.50＊	B'試題難度適當但含異質性
21	14	42.4	0.13	B 適當
23	14	42.4	0.43	B 適當
26	13	39.4	0.18	C 困難
04	13	39.4	0.21	C 困難
17	13	39.4	0.28	C 困難
08	12	36.4	0.33	C 困難
33	10	30.3	0.29	C 困難
32	8	24.2	0.30	C 困難
31	2	6.1	0.54＊	C' 異質‧不適當
24	1	3.0	0.65＊	C' 異質‧不適當

第二次形成性評量試題的注意係數（Cp）可看出此次測驗中，絕大部份試題難易適中，但其中19.25題的Cp=0.5，表示題目難度雖適當但含有異質成份，應加以注意檢討。另外，31.24的題目難度過高且含異質因素或編製不當，應予以修改或刪除。就整體而言，整份試卷的試題尚稱適當，其中約1/4的試題對該班學生而言仍屬邊難，提示仍有繼續進行教學的空間。

綜一丁　第二次形成性評量S-P曲線圖

S曲線P曲線

1 0

2 6

1 2

6 2

0 0

2 1

2 2

9 8

2 1

7 8

2 3

0 0

1 1

5 1

0 1

3 3

1 0

4 9

2 2

5 1

2 2

3 6

0 1

4 7

0 3

8 3

3 3

2 1

答對人數

答對率(%)

2 2

3 2

2 2

1 1

2 2

1 1

9 9

1 1

8 8

1 1

8 8

1 1

8 8

1 1

8 7

1 1

7 7

1 1

5 4

1 1

4 3

1 1

3 3

1 1

2 0

0 0

8 2

答對人數

經由S-P曲線圖分析顯示，從P曲線的形狀可看出試題的答對率約在50%。從P曲線的形狀可看出試題的答對率約在18%至88%之間。再者，S曲線呈現S字型，可看出得分率50%的學生佔相當多數，靠近滿分或零分的學生人數相當少。其類型可歸於一般標準學力測驗的類型。

根據S曲線作出相對應的成績分佈後的直方圖，可看出此次評量結果呈現常態分佈。

次數分佈(直方圖)

綜一丁總結性評量

學生S表

座號	答對題數	答對率(%)	注意係數	偏差值	學生診斷分析
33	33	100.0	0.00	74.8	A　學習穩定
8	28	84.8	0.51＊	65.9	A' 粗心大意
1	27	81.8	0.12	64.1	A　學習穩定
3	27	81.8	0.14	64.1	A　學習穩定
11	26	78.8	0.28	62.3	A　學習穩定
18	25	75.8	0.23	60.5	A　學習穩定
15	23	69.7	0.12	56.9	B 標準
6	23	69.7	0.23	56.9	B 標準
27	22	66.7	0.18	55.1	B 標準
2	22	66.7	0.25	55.1	B 標準
21	22	66.7	0.30	55.1	B 標準
30	21	63.6	0.19	53.3	B 標準
32	20	60.6	0.08	51.5	B 標準
23	20	60.6	0.11	51.5	B 標準
29	20	60.6	0.14	51.5	B 標準
19	19	57.6	0.16	49.7	B 標準
24	19	57.6	0.25	49.7	B 標準
16	18	54.5	0.16	47.9	B 標準
26	18	54.5	0.22	47.9	B 標準
31	18	54.5	0.25	47.9	B 標準
9	18	54.5	0.26	47.9	B 標準
4	17	51.5	0.13	46.1	B 標準
10	16	48.5	0.19	44.3	B 標準
20	16	48.5	0.22	44.3	B 標準
17	16	48.5	0.31	44.3	B 標準
7	16	48.5	0.34	44.3	B 標準
28	16	48.5	0.35	44.3	B 標準
12	15	45.5	0.36	42.6	B 標準
22	13	39.4	0.36	39.0	C 學力不足
14	11	33.3	0.31	35.4	C 學力不足
25	10	30.3	0.27	33.6	C 學力不足
13	9	27.3	0.43	31.8	C 學力不足
5	8	24.2	0.42	30.0	C 學力不足

　　本單元總結性評量學生回答問題的注意係數（Cs）顯示，8號學生雖成績不錯，但粗心大意，學習欠穩定，應叮嚀其作答後宜仔細檢查答案後才交卷，以矯正其粗心的習慣，使學習趨於穩定。其他學生診斷分析屬「A」者，教師予以持續的鼓勵，以維持其學習穩定性；學生的特徵屬「B」者，表示該學生的學習狀況尚穩定良好，惟努力程度較不足。教師應提示其學習方向，鼓勵奮發，即可激勵其學習成果有所進展。至於屬於「C」區的22.14.25.13.5號學生，基本學力不足、用功不力，以致學習成就偏低，教師應給予更多的時間去學習，同時施予補救教學。

綜一丁總結性評量

問題P表

一般答對率(%) 上限85%~下限40%
題號	答對人數	答對率(%)	試題注意係數	試題診斷分析
14	29	87.9	0.35	A 容易
13	27	81.8	0.06	B 適當
28	27	81.8	0.09	B 適當
08	27	81.8	0.12	B 適當
03	27	81.8	0.16	B 適當
05	27	81.8	0.24	B 適當
15	27	81.8	0.26	B 適當
31	26	78.8	0.43	B 適當
04	25	75.8	0.14	B 適當
24	24	72.7	0.22	B 適當
26	24	72.7	0.24	B 適當
07	24	72.7	0.29	B 適當
06	22	66.7	0.15	B 適當
25	22	66.7	0.24	B 適當
12	19	57.6	0.31	B 適當
18	18	54.5	0.13	B 適當
11	18	54.5	0.17	B 適當
09	18	54.5	0.32	B 適當
22	17	51.5	0.16	B 適當
32	16	48.5	0.14	B 適當
19	16	48.5	0.16	B 適當
10	16	48.5	0.29	B 適當
29	16	48.5	0.45	B 適當
23	16	48.5	0.46	B 適當
17	15	45.5	0.23	B 適當
01	15	45.5	0.40	B 適當
33	14	42.4	0.12	B 適當
27	13	39.4	0.33	C 困難
21	10	30.3	0.09	C 困難
30	10	30.3	0.31	C 困難
16	10	30.3	0.39	C 困難
02	9	27.3	0.45	C 困難
20	8	24.2	0.24	C 困難

　　本單元總結性評量試題的注意係數（Cp）皆小於0.5，表示此次測驗試題品質不錯，未含異質成分，無需檢討修正。根據試題診斷分析結果可知，大部份的試題屬於「A」、「B」兩區，相當適合該班之學生程度，適合用來測量學生本單元的學習成效。另外，屬於高難度「C」區的試題，對學力不足的學生而言，很難作答，但也不含異質成份，故不必修改，只需增加教學與學習輔導。

綜一丁總結性評量S-P曲線圖

S曲線P曲線

0 0

3 5

1 3

5 1

0 2

4 4

2 0

6 7

0 2

6 5

1 1

2 8

1 0

1 9

2 3

2 2

1 1

9 0

2 2

9 3

1 0

7 1

3 2

3 7

2 3

1 0

6 2

答對題數

答對率(%)

2 2

7 7

2 2

7 6

2 2

5 4

2 2

4 4

2 2

1 1

9 8

1 1

8 8

1 1

7 6

1 1

6 6

1 1

6 6

1 1

5 5

1 1

4 3

1 1

0 0

1 0

0 9

答對人數

經由本單元總結性評量S-P曲線圖顯示，從S曲線或P曲線之位置可看出學生平均答對率約60%，較前兩次的形成性評量結果進步。從P曲線之形狀可看出試題之答對率約在25%至100%之間。再者，S曲線呈現S字型，可看出得分率60%的學生佔相當多數，靠近滿分或零分的學生人數相當少。而且，S和P兩曲線的分離程度較前兩次形成性評量為小，表示絕大多數學生的作答，反應組型趨於一致，因此，個別學生（如8.13.5號）的作答反應組型與班上其他學生的作答反應組型相較，由圖表中可看出明顯差異，方便教師進行差異原因的探究和學習困難的診斷。

根據S曲線作出相對應的成績分佈後的直方圖，可看出此次評量結果亦呈現常態分佈。

伍、結論與建議

　　S-P表分析是結合認知理論和測驗理論所發展出來的認知診斷評量技術，將學生在試題的作答反應予以圖形化的測驗分析法。本研究以S-P圖表分析英語教學評量的結果，以了解個別學生的學習行為、個別試題的異質性、全班學習成效及整體測驗的品質。以S-P表為學習評量的分析工具，針對教學評量的結果進行「質、量並重」的分析與診斷，提出改進英語教學及提昇測驗品質之參考資訊。對於傳統的「打分數、排名次」的測驗評量，提供更多的回饋訊息，使測驗能確實發揮評量的功效，達到有效的教學。總之，在善用S-P表於英語教學評量的過程中，S-P表成為有用的教學輔助工具，建立活化有效的教學管理系統，不僅可了解學生的學習成就，亦能找到診斷學習困難及檢討試題品質的線索，以提供教學設計與實施的改進之依據，一方面可幫助教師檢討自我教學策略的得失，增進教學效率；另一方面可幫助早期發現學習適應不佳的學生，以作為補救教學的參考。