試論基于課程標準的學生學業(yè)成就評價

時間:2023-05-01 09:18:33 自我評價 我要投稿
  • 相關推薦

試論基于課程標準的學生學業(yè)成就評價

試論基于課程標準的學生學業(yè)成就評價

試論基于課程標準的學生學業(yè)成就評價

摘要:為什么要將學生學業(yè)成就評價建立在課程標準之上,意義何在?為了設計基于課程標準的學生學業(yè)成就評價,地方或學校怎樣對課程標準進行進一步的處理,將其轉化為評價標準?怎樣讓學生的學業(yè)成就評價建立在課程標準之上?本文圍繞這三個核心問題,給出思考和行動的框架,并不在求得劃一的程序,旨在引發(fā)有益的思考。

關鍵詞:課程標準;學業(yè)成就評價

Abstract: What's the significance of assessing students'achievements on the bases of curriculum standards? What should the localities and schools do to transform the curriculum standards into assessment standards to assess students' achievements? What could we make the do to assessment students' achievements based on the curriculum? Some thinking and action frames procedure but expects to initiate some helpful thinking.

在我國當前的教育環(huán)境下,課程標準取代教學大綱并不難,難在要使課程標準真正發(fā)揮作用,成為教材編寫、教師教學和學生學業(yè)成就評價的依據。這三點中無論哪一點都不是一件簡單的事情,尤以學生學業(yè)成就評價為最。只有當評價這一最后的出口是基于標準的時候,前兩者才有可能是基于標準的。但關于基于標準的評價,目前國內還沒有太多研究,在對學生學業(yè)成就評價改革的方向、內容的眾說紛紜中,標準似乎被有意無意地遺忘了。事實上,這次課程改革的諸多理念都凝聚在標準上,如果在評價和標準間遲遲不能建立有意義的聯(lián)系,將使我們的評價和標準都無所依托。這就難怪美國加利福尼亞大學的評價研究中心(CSE,Center for the Study of Evaluation)在2002年的報告中宣稱:基于標準的教育體系的成功依賴于兩個要素:強有力的標準和能衡量出標準所期望的學習結果的評價;诖,本文旨在厘清基于標準的學生學業(yè)成就評價中的三個關鍵問題,為地方和學校進一步設計基于標準的學生學業(yè)成就評價提供思考和行動的框架。①

一、為什么學生學業(yè)成就評價要基于課程標準

意義的問題看似簡單,但如果我們不能開展廣泛而有益的探討,厘清“為什么這樣做”的清晰意義,并讓實踐者建立堅定的行動決心,政策和實踐往往會出現(xiàn)反彈和逆流。因此,我們需要從最原點的問題來思考:“學生學業(yè)成就評價的目的是什么?課程標準是怎樣促成學生學業(yè)成就評價達成此目的?”從最根本的層面上說,學生學業(yè)成就評價有兩個目的。對外,要能滿足公眾問(accountability)的要求;對內,要能滿足學生學習改善(improving learning)的要求。而從下文的分析中我們可以看到,這兩個目的的實現(xiàn)都離不開課程標準。課程標準是學生學業(yè)成就評價達至公平、有效的基石,它承擔著學業(yè)成就評價標準的功能和職責。 [2][1]Key words: curriculum standards; achievement assessm

(一)課程標準規(guī)范學業(yè)成就評價的設計理念

任何一種學業(yè)成就評價都是基于對教學、學習、學習者的能力的假設而做出的,這些隱藏的設計理念在很大程度上決定了學業(yè)成就評價的性質、范圍、方法、使用的工具。課程標準的意義就在于對不同類型的學生學業(yè)成就評價從基本的設計理念上進行統(tǒng)一。

當前實踐中的各級考試很少以學習、教學、學習者的能力的共同期望為設計基礎。不同的考試之間沒有聯(lián)系,甚至出現(xiàn)相互矛盾的情況。在這種情況下,難以保證教育質量,難以應對日益強烈的問責要求,更難以促進學生的學習。課程標準所蘊涵的“為了每一位兒童發(fā)展”的理念旨在促進學生全面、持續(xù)、和諧地發(fā)展,它相信每一個兒童的可塑性和巨大的潛力。它認為真正的有效教學不是灌輸,而在于從學生已有的生活經驗和概念基礎出發(fā),幫助學生建構他們自身的知識框架。這種觀念給各級學業(yè)成就評價的設計帶來新的可能性,只有建立在這一理念基礎上的學業(yè)成就評價才能真正應對今日的公眾問責,才能真正促進學生的學業(yè)改善。

(二)課程標準提供學業(yè)成就評價的維度框架

學業(yè)成就評價應該評什么?當前的學業(yè)成就評價的考察維度是比較單一的,有的甚至僅僅測量了學生的記憶力。地方或學校往往通過設立特定的分數(shù)界限比較各地、各校、各學生之間的差異,衡定誰好誰劣,借此達到問責要求。缺少專業(yè)評價素養(yǎng)的公眾很難追問:這張考卷考察的是學生的哪些能力呢?不同考卷所代表的80分差異在何處?但是,很多研究都表明,為了應對越來越激烈的競爭和挑戰(zhàn),為了促進學生的有效學習,學業(yè)成就評價的維度需要并正在擴大。而課程標準正給我們設計學生學業(yè)成就維度框架提供參照。

課程標準是對學習結果的界定。它對學習結果的理解并不像一般人理解的那樣,只是學習成績,它包括多種學習結果,以數(shù)學課程標準為例,就從知識與技能、數(shù)學思考、解決問題、情感與態(tài)度等四個方面作出限定?傊俺珜W生主動參與、樂于探究、勤于動手,培養(yǎng)學生搜集和處理信息的能力、獲取新知識的能力、分析和解決問題的能力以及交流與合作的能力。”[4][3]課程標準給我們設計學業(yè)成就評價的維度提供參照,它促使我們思考:學業(yè)成就評價到底評哪些維度?它們之間的比重是均衡的嗎?學業(yè)成就評價應該設計怎樣的工具、方法來測量、報告、解釋它們?

(三)課程標準限定學業(yè)成就評價的內容范圍和認知要求

學生學業(yè)成就評價需要基于統(tǒng)一的內容范圍和一致的認知要求。如果不同類型的學業(yè)成就評價是基于不同范圍的學習內容和不同程度的認知要求而制定的,必然會引起極大的混亂。當前的很多學業(yè)成就評價是經不起追問的:選擇考察的樣本能夠代表同樣的知識內容嗎?對認知的要求有偏差嗎?這就導致學校和教師對到底要學哪些知識,要學到何種程度感到無所適從,只能用大量的題海戰(zhàn)術來對付。因此,課程標準要對學業(yè)成就評價在內容范圍和認知要求上做出限定。

課程標準從本質上說就是設立全國學生要知道些什么,做些什么的底線。它不僅劃定了學習的領域和疆界,還給出學到何種程度的描述,即內容標準和表現(xiàn)標準,前者劃定了學習的領域,保證學生學到、考到的內容是全面而均衡的。后者回答“很好是多好?”“怎樣好才是足夠好?”等問題,促進學生在不同程度上的學習。通過將學生學業(yè)成就評價設立在標準之上,可以規(guī)范不同類型的學業(yè)成就評價,減少偏題、怪題,也可以比較容易地形成一套教師、學校、地方和國家不同層級協(xié)調一致的綜合的學生學業(yè)成就評價體系。

二、怎樣將課程標準轉化為評價標準

在解決意義問題之后,我們需要關注的一個瓶頸問題是如何將課程標準變成評價標準,因為課程標準的規(guī)定性相對而言是比較弱的。它按照年段進行設計,是對學生課時目標的累積期望,而且目前的課程標準對學生的認知要求并不十分明確,這就使課程標準的規(guī)定性要大大低于教學大綱,顯得比較“含糊”,作為評價標準就顯得規(guī)定性不足。因此,在設計基于標準的學生學業(yè)成就評價的時候,地方和學校就不能直接應用標準,而是要對標準進行一定的處理,將年段的內容標準進一步細化為年級內容標準、單元內容標準、每節(jié)課的內容標準等等,并制定出相應的表現(xiàn)標準,以作為評分時的依據。它們之間的關系用下圖可以表示得更加清楚。

圖1 各級標準之間的關系

(一)內容標準的技術考量

國家對基礎教育的絕大多數(shù)課程都已經設定標準,但是綜合實踐活動和校本課程還沒有統(tǒng)一標準,所以在考慮內容標準的時候,又分成兩種情況,一種是針對那些已有標準的課程,另一種是針對那些沒有統(tǒng)一標準的課程。對已有的內容標準的處理可以遵循以下幾個步驟: 第一,對內容標準的處理進行規(guī)劃。對諸如誰參加內容標準的處理工作,責任和權限如何,資金怎樣分配,技術如何保障,時間如何安排等一系列問題的規(guī)劃。在確定參與人員時,最重要的是選擇多樣性的代表。

第二,進行背景研究,深入理解課程標準。搜集并研究與標準有關的各類文獻。尋找課程標準中所有的關鍵概念、命題、公式,并確認它們的邏輯關系。這一步的研究保證課程標準中的所有內容在地方和學校自行形成的標準中得到全面體現(xiàn)。

第三,對內容標準細化、調適。這一階段是極為重要的,雖然在地方和學校形成的各級[6][5]

內容標準中必須覆蓋國家制訂的所有標準,但對不同地方和學校來說,可以有不同的組織和呈現(xiàn)方式,也應該針對不同情況進行細化。在這一階段,地方和學校應該提供機會建立不同類型的溝通機制和討論機制。將大量的基層教師納入其中,傾聽他們的聲音。

第四,運用多樣的方法對處理后的標準進行評論和驗證?梢圆捎猛獠吭u論委員會、中介機構、焦點小組等方式。

第五,在內容標準處理的最后階段,應該將研究的資料和結果加以總結整理,并告知不同的利害關系人。

標準的形成并不是一勞永逸的,而建立的評價又是高利害的,因此,應該每隔一段時間就對標準進行再檢視和修訂。同時,要防止這樣的誤解:只有評價可以修改,標準就一定是正確的,事實上,通過評價的數(shù)據對標準進行進一步的完善也是一種可行并必要的方法。

學校內實施的課程有一小部分是沒有標準的,如綜合實踐活動、地方課程、校本課程,這些課程因為是根據學校、地方的具體情況而開設的,所以無法制訂統(tǒng)一的內容標準。但是,對那些有條件的地方和學校來說,引導教師們積極討論,審慎思考“學生應該知道什么,能做什么”,開發(fā)出一定的核心內容標準,也是可行的,而且這本身就是非常有益于對這類課程的性質、意義、教學和評價策略的專業(yè)探討。形成新的內容標準的步驟大致也是遵從上面的步驟,但要考慮到教材、評價之間的一致性。

(二)表現(xiàn)標準的技術考量

基于標準的學生學業(yè)成就評價需要清晰的表現(xiàn)標準,才不至于在設計評價或者制定評分量規(guī)時引起歧義。惟在于國家層面上的表現(xiàn)標準比較模糊,例如,數(shù)學標準第一學段的“數(shù)與代數(shù)”,“能靈活運用不同的方法解決生活中的簡單問題,并能對結果的合理性進行判斷”。對這些表述,都是很難達成共識的,什么程度算“熟練”,怎樣才是“靈活”,都需要地方和學校進一步明晰。因此,為讓地方、學校、教師明白什么樣的好才是好,做到什么程度就夠了,地方和學校在國家標準的基礎上進一步發(fā)展起來的表現(xiàn)標準,應該是清楚、具體、可測的。

完整的表現(xiàn)標準體系包括以下四個方面,地方和學校可以借助以下框架并根據自己已經開發(fā)出來的內容標準思考對表現(xiàn)標準的處理:(1)表現(xiàn)水平:學生表現(xiàn)級別,如優(yōu)秀、比較優(yōu)秀、一般等;(2)表現(xiàn)描述:描述各級表現(xiàn)水平上學生知道什么,應該做什么;(3)范例:說明各個表現(xiàn)水平上學生作業(yè)樣例(應該包括與內容標準的整個范圍和深度有關的樣例);(4)分數(shù)線:區(qū)分各級表現(xiàn)水平的分數(shù)。

[7]②

表注:這一問題是整個表現(xiàn)標準形成過程中最為重要的問題。關于如何編制有如下一些過程和策略:收集國內外已有的表現(xiàn)描述文本;與專家協(xié)商;研究內容標準;研究評價資料;描述出各個表現(xiàn)水平的期望草案。

在進一步形成表現(xiàn)標準的過程中,地方或學?伤伎既缦乱恍﹩栴},可能更有助于表現(xiàn)標準的合理化:

對教師來說,限于時間、精力和能力,往往不可能開發(fā)出如上所述的非常精致和完善的表現(xiàn)標準,所以教師在進一步思考表現(xiàn)標準的時候,尤其是在處理綜合實踐活動、校本課程等沒有統(tǒng)一的表現(xiàn)標準參照的課程的時候,有一個簡易的辦法,就是將已經制訂的內容標準的關鍵特征轉為“我能”的陳述。從學生的角度看,“我能”的陳述可以幫助學生獲得標準所要求的關于學習目標的清晰圖像。如“我能閱讀關于科學、歷史等主題的教材或文章”,“我能選擇一個我喜歡的作者或是某種類型的文章并閱讀其中的節(jié)選”。

三、怎樣讓學生學業(yè)成就評價建立在標準之上

這是基于標準的學生學業(yè)成就評價中很關鍵的一個問題。它保證學業(yè)成就的分數(shù)是基于課程標準的測驗,保證從學業(yè)成就測驗而來的結果與解釋的有效推論。美國在開發(fā)基于標準的測驗的過程中,州的典型做法是要求測驗開發(fā)者創(chuàng)建與課程標準匹配的測驗,再對其進行匹配度(alignment of standards and assessment)檢驗和一系列的試卷分析。迄今為止,已有四種比較成熟的模式來幫助判斷學生學業(yè)成就評價和標準之間的匹配、一致程度:(1)韋伯模式(Webb model);(2)實施課程的調查模式(surveys of enacted curriculum model);(3)成就公司模式(Achieve Inc.model);(4)基礎教育委員會模式(Council for Basic Education model)。③我們對這四種模式進行總結,提煉出如下的操作程序。

(一)形成考察匹配程度的維度

衡量評價和標準之間的關系,并不是簡單的是或否的問題,而是一系列的集中性回答匹配程度的維度。這四種模式雖然關鍵特征、所使用的方法各有不同,但都是將基于標準的評價分成若干維度來審視。僅在于一開始就思考評價維度的形成是比較困難的,我們可以從問題入手,將“怎樣將評價建立在標準之上”這個大問題分解成如下幾個小問題。

(1)是否每個評價衡量的都是在標準里反映出的內容和技術?

(2)是否每個評價都是對標準所反映的重要的知識與技能的公平、有效的抽樣?每種評價在何種程度上衡量了那個年級水平的關鍵內容和技術?

(3)是否每個評價都具有足夠的挑戰(zhàn)性?因為要測量標準中所強調的知識和技能是很容易的,而對那些復雜的概念、拓展性推理和高級思維很難測量。

當然,這樣的分解并不是絕對的,還可以有其他的分解方法?紤]到對初次涉入此領域的地方或學校來說,還是比較抽象的。如成就公司發(fā)展出了如下四個維度:內容的集中性

(content centrality);表現(xiàn)的集中性(performance centrality);挑戰(zhàn)(challenge);平衡和范圍(balance and range);A教育委員會發(fā)展出了另外四個維度:內容(content)、內容平衡(content balance)、嚴密(rigor)、項目反應類型(item response type)。地方或學?梢愿鶕约旱膶嶋H情況進行維度的開發(fā)。

(二)考察測驗細目表

在評價員將自己的觀點加在評價之前,首先要傾聽評價開發(fā)者的聲音,最省力的途徑就是考察細目表。因為測驗細目表是測驗形成的依據,所以第二步就考察測驗細目表,檢視開發(fā)者自己的題目和標準之間的一致性。當然,這要建立在評論員對標準和與之相關的各種文本進行深入研究的基礎上。

評論員要審慎查看細目表檢測的是哪些標準,是否包括了應當有的標準,對標準的理解和所列舉的范例是否適當,每一個標準所分配的題目數(shù)及題目質量等是否合適,并在檢視過程中就先行剔除那些明顯不符合標準或有錯誤的題目。在分析測驗細目表時,要輪流檢查每一個題目,并確認題目內容和標準內容是否匹配。有時候一個題目會牽涉幾個標準,這時評論員就要非常謹慎,區(qū)分這個題目主要是測量哪一個標準。必要時,評論員可以自己對照標準形成測驗細目表,并將自己的細目表和測驗開發(fā)者形成的細目表加以比較。這一階段結束后,最好要有一個簡要的報告呈現(xiàn)給開發(fā)者,以作為改進測驗之用。

(三)對題目逐一進行分析

測驗題目通常都由兩個方面組成。一是題目的內容,二是題目的認知要求,如記憶、選擇、分析、歸納等等,所以對題目的分析也從這兩方面來進行。前者要求評論員檢視每一個題目內容和與之相連的標準內容。在進行分析的時候,評論員要考慮標準的特性和細化程度,以及它要評價的內容的范圍。后者要求評論員考慮每個題目的認知要求和標準所描述的認知要求之間匹配的質量。這一點往往被人們忽略,但卻是非常重要的,常見的錯誤就是當標準強調高級思維的時候,而測驗題中往往只是用背誦、記憶的方式來檢測。

值得注意的是,在這里要考察的并不僅僅是題目,還包括對標準的進一步處理,因為,有時評價不是基于標準的原因在于標準,當標準過于寬泛或是用詞含糊時,也會出現(xiàn)不能匹配的現(xiàn)象,因此,韋伯也指出,匹配度的檢驗程序必不可少的一步是學術標準的系統(tǒng)性分析,并認為標準分析應該先于評價分析進行。[10] [9][8]

(四)整體測驗的質量分析

完整的考察標準和評價的匹配程度不僅要考察單個的題目,還要對整體的試卷進行分析。對一個個題目的考察是基礎,對整體的試卷進行分析以考察標準之間的相互聯(lián)系更為重要。以成就公司模式為例,在它發(fā)展出的四個維度中,前兩個維度是對單個的題目進行的分析,而后兩個維度“挑戰(zhàn)”“平衡和范圍”就是考察整體試卷的質量。挑戰(zhàn)又可以分成兩個方面,一是挑戰(zhàn)的來源,二是挑戰(zhàn)的水平。前者是保證題目的難度來自標準所指向的知識和技能。后者要評論員考慮到被評價的概念的性質和學生要得出答案所要進行的思維類型,測驗中的

一系列題目對特定年級水平的學生是否富有挑戰(zhàn)性做出總體的判斷。它認為考慮挑戰(zhàn)這個因素是保證我們可以基于測驗做出這樣的推論:學生在這些題目上做得好是因為學生掌握了富有挑戰(zhàn)性的學科內容,學生在這些題目上表現(xiàn)不好,就是因為他沒有掌握

試論基于課程標準的學生學業(yè)成就評價

這些內容,而不是因為學生的背景知識等其他原因。平衡和范圍是指整個測驗應該覆蓋標準的完整范圍,同時也要注意不同重點之間的適度平衡。

此處的基于標準的學生評價并非從測量學的角度來講,它不是標準化測驗(standardized test),也不是標準參照測驗(criterion-referenced test),更不是20世紀70~80年代提倡的“最低能力”、“掌握學習”。

尤其是對累積性標準考慮,各個學校是不同的。要經過一個年級段才能達成的目標怎樣將其納入到各個不同的年級和單元主題中去,各個地方和學校的考慮是大不相同的。 ②①

可以看到,這四種模式都是由外部的中介機構接受州或地方的委托而做的,這樣就可以避免對內部評價的公信度的拷問。但是,這樣的機構在我們國家現(xiàn)在還是缺失的,隨著改革的繼續(xù)推進,獨立的能夠對測驗進行評估的機構的建立勢在必行。

參考文獻:

[1]Robert Rothman,Jean B.Slattery,and Jennifer L.Vranek.2002.Benchmarking and Alignment of Standards and Testing.CSE Technical Report 566.http://www.cse.ucla.edu.

[2]Stephen Chappuis,Richard Stiggins,Judith Arter,and Jan Chappuis.Assessment For Learning.Portland,OR:Assessment Training Institute.2005.

[3]Mien Segers,Filip Dochy and Educardo Cascallar.Optimising New Modes of Assessment;In Search of Qualities and Standards.Dordrecht;Boston:Kluwer Academic Publishers.2003.3. [4]教育部.基礎教育課程改革綱要(試行),2001.

[5]No child left behind issue brief:a guide to standards-based assessment 2000.http://www.ecs.org/ clearinghouse.

[6]Goals 2000:Educate America Act.http://www.ed.gov/ legislation/Goals 2000/The Act.

[7]Hansche.Meeting the Requirements of Title I:Handbook for the development of Performances Standards.Washington,DC:Council of Chief States School Officers.1998.

[8]Robert Rothman,Jean B.Slattery,and Jennifer L.Vranek.Benchmarking and Alignment of Standards and Testing.CSE Technical Report 566.2002.

[9]Council of Chief State School Officers.Models for Alignment Analysis and Assistance to States.ERIC.2002.

[10]Webb N L.Alignment of Science and Mathematics Standards and Assessments in Four States.Washington,DC:Council of Chief State School Officers.1999.

【試論基于課程標準的學生學業(yè)成就評價】相關文章:

學生學業(yè)成就自我評價11-10

學業(yè)成就自我評價11-17

學業(yè)成就自我評價03-30

高中學業(yè)成就自我評價03-27

初三學業(yè)成就自我評價05-04

學生學業(yè)評價評語12-28

學業(yè)成就方面自我評價范文(通用7篇)12-01

學生學業(yè)評價評語大全05-18

學生學業(yè)評價評語170句06-14

學生學業(yè)水平的自我評價(精選18篇)06-27