從選拔性評價進階為增值評價,考試“指揮棒”變了,會帶來哪些影響

從選拔性評價進階為增值評價,考試“指揮棒”變了,會帶來哪些影響

考試,尤其是重要考試,一向被認為是教學評價或人才選拔的工具。中共中央、國務院日前印發的《深化新時代教育評價改革總體方案》提出,要改進結果評價,強化過程評價,探索增值評價,健全綜合評價。

和“以分數論英雄”的傳統評價不同,所謂“增值評價”,即是以學生的進步幅度來評價學校。

上海市教育考試院近日舉辦的主題為“新時代考試製度改革與評價”的2020學術研討會上透露了一組數據:根據上海2014年至2016年的三年中考成績以及對應的2017年至2019年的高考成績,進行大數據分析後發現,不同的學校對學生的增值作用不盡相同。

數據顯示,單以學生入學時的高利害考試平均分來看高中三年的教育增值會發現,排名前15的學校幾乎都是大眾心目中的名校;而如果考慮招生政策對生源結構的影響,排名前15名的學校就會有巨大的改變。簡言之,這些學校並沒有特殊招生政策的支持,所招學生的中考分數更低,但是通過三年高中教育,增值更多。

研討會上,學者熱議的一大話題即是:當下的教育評價,如何從傳統的選拔性的評價“進階”為增值評價,繼而對教育起到更大的推動作用?

一味以“提分”為目標,學校和學生將陷入高度同質化

教育評價本身就是一門科學,尤其是高利害的考試,如果評價功能發揮出色,就能起到真正的 “指揮棒”作用——引導教育不斷改進,為學生、學校和教育本身增值。

“教育增值,需要通過教育評價的改革來實現。”上海市教育考試院院長鄭方賢直言,教育評價要實現增值評價的目標,才能為推動學校發展以及教育質量提升提供可能性。

因為,評價方式本身就體現了價值判斷。當高利害考試的評價標準是諸如考試分數、“清北率”這樣的目標時,那麼評價就會注重分數的提升;要實現真正的教育增值,則需要對評價標準和內容進行重新設置。否則,學校的發展動力很容易變成“收割”高分學生,發展目標則傾向於通過教育為學生 “提分”,而不是更全面地為學生、學校乃至整個教育“增值”。一旦如此,那將會陷入一個循環——好學校招好學生、取得好的升學成績,並獲得更多資源支持以及更多好生源——最終的結果,就是學校和學生的高度同質化發展。

改變這一現狀,真正破除教育評價的 “唯分數、唯升學、唯文憑、唯論文、唯帽子”,也正是高考改革啓動的初衷,也是新高考承擔的期待。不過,鄭方賢也坦言,“就目前的考試來説,如何將綜合素質培養以及學生在學校期間的成長過程納入教育評價,並在增值評價中體現,仍然是巨大的挑戰。”

教育評價與教學過程不一致,會增加學生負擔

研討會上,不止一位專家提出要推動教育評價的教育增值作用,必須要加大教育評價與教學過程的一致性研究。

“如果教育評價與平時的課程教學實施缺乏一致性,那就會使學生湧向培訓機構,通過課外培訓來完成學業與教育評價的對接。”在市教委副主任倪閩景看來,教育評價如果以分數為標準,但課程實施又是以增值為指向,那學生必然會通過培訓機構來補齊缺失的一部分,“這不僅增加學生的學業負擔,對於教育本身來説,也不可能發生增值”。

以高中課程為例,不同學科的教學和考試難度,如何結合學生課程學習的負擔進行合理設置,需要教育評估機構在學校課程教育基礎上進行研究。“這對教育主管部門及教育評價機構來説都是巨大的挑戰。”湖南師範大學測評研究中心主任楊志明説,一些發達國家的經歷就為我們提供了經驗和教訓。

比如,美國高中的STEM課程,每一門課程的難度設置都很高,甚至直接與大學課程對接,如果學生全部都學,那麼負擔勢必非常重,因此這些課程是選擇性的。但也正是因此,人性中趨易避難的特點被放大,這從長遠來看,勢必會導致人才培養的不均衡,國家人才儲備受到影響。統計數據顯示,美國相對較好的高中只有71%的學校開全了STEM課程,而只有16%的高中生數學和科學達到了良好水平。

還有學者提出,如果教育評價指向增值,那麼在課程實施的過程中,以現在的教學體系,如何避免優等生的“天花板困境”和一般學生的“刷題提分”,就是一個值得研究的問題。

在當下的教學體系中該如何為優秀的學生提供更多上升空間?據悉,一些發達國家的中學嘗試了大學先修課程來解決優秀學生在學校提升空間不足的難題。但對於學業水平一般的學生,要避免他們“刷題提分”,同時又要讓那些創新人才能脱穎而出,則是目前教育界面臨的難題。

更科學的教育評價,需應對技術與人才的雙重挑戰

部分學者認為,要真正實現增值評價,那麼諸如目前的中考、高考等高利害考試就不應該僅僅關注結果,而是應該更關注過程。而新高考方案實施至今,學生成長和發展的過程性評價如何更好地體現,從實踐看,目前既面臨技術層面的挑戰,也遭遇人才層面的挑戰。

“教育評價的科學性遠超我們想象,絕對不是出一套考卷、根據考分排名這麼簡單。”楊志明直言,相對於技術發展來説,教育評價與新技術的融合仍顯落後。

“一些海外測評機構對考試的科學研究以及技術支持已非常深入。比如,人工智能現在可以批改作文、測評口語,即便是主觀題的分步計分,也能夠通過數學模型來推動人工智能參與測評。”楊志明説,現代教育評價需要大量的科學和技術的支持,而非僅憑經驗的工作。再比如,部分人推崇建立題庫。但是,一個千道題的題庫,最多20個人參加考試就可以“掏空”,更不用説題庫中題目的難度設置、根據答題人的水平不斷調整推送等,都需要專業支持。

除了技術,人才也是教育評價探索教育增值必須要解決的問題。科學的教育評價必須要有命題研發團隊、測評分析團隊、信息技術團隊、管理服務團隊等。“即便是師範類高校,目前也沒有專門的測評人才的培養,大多數相關人才的培養都‘藏’在教育學專業或者是心理學專業的心理測量方向。”楊志明説,即便是這些人才,離真正的教育測評專業人才也有較遠的距離。

研討會上不少學者建議,要加強教育評價行業標準、學術標準和管理標準的建設,要加快專業隊伍的建設,探索將學生的學習成果分為認知、非認知的,心理、行為等類型並納入增值評價體系。未來這些評價體系甚至將影響到教育資源的分配,從而進一步改善教育生態。


作者:姜澎
編輯:顧軍
責任編輯:樊麗萍

*文匯獨家稿件,轉載請註明出處。圖丨本報資料圖片

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2474 字。

轉載請註明: 從選拔性評價進階為增值評價,考試“指揮棒”變了,會帶來哪些影響 - 楠木軒