楠木軒

“高分通脹”的背後是教育的悲劇

由 戚國慶 發佈於 經典

這本是《光明日報》的一篇舊文,看到今年的中高考成績,覺得有必要再次反省這種高分考生越來越多的現象,稍加修改再次發表。

今年中高考分數公佈,和我們預設的疫情影響分數下降的場景不同,各地高分考生紛紛井噴。

北京中考滿分580分、570以上的考生創造了紀錄,超過1400餘人(一説1300餘人),而去年僅有9人。高考也一樣,700分以上達到了80人,而2019年僅有24人。中高考都創下了歷史最高紀錄。

不止是北京。上海中考考生總量約8萬人,數學成績在141-150(150)分的有26988人,136分以上的總數達到3.78萬人,幾乎逼近所有考生的一半。英語成績在141-150分的高達15985萬人,136分以上的也高達3萬多人。

在河南,高考600分以上的考生達44162人,700分以上考生169人,但2019年高考狀元也僅有702分。在河北,600分以上考生也超過了3萬人,700分以上106人,均大幅提高,創造了歷史最高紀錄。

都是高分考生,分數的篩選價值越來越微弱,也不斷加劇着分數的競爭,已經不再是分分計較,中考甚至是零點幾分的計較。

選拔性考試變得越來越水平化、簡單化,甚至模式化,高分考生越來越多。

以前的中高考不是這樣的,作為一項選拔性考試,其區別度還是顯著的。也就是説,學業優秀與否,分數差距是很大的,第一名與第二名之間差距也不小。在中高考中,滿分是極其稀缺的,能有一兩個人或者幾個人已經了不起了。但現在,想當第一名,恨不得要求你門門是滿分或者逼近滿分。

為什麼會這樣?

總體上原因比較複雜,在我看來,大體有五方面的原因。

第一,把考試難度與負擔強行掛鈎,一直試圖通過降低考試難度來減負。

第二,求穩成為各地中高考的核心政治訴求,民意訴求,導致中高考考試不斷模式化,考試內容與題型甚至大面積固化。

第三,與招生改革的指導思想有關,相關部門一直希望以水平測試替代選拔性考試,破解應試教育,破解對分數的追求。

第四,家長對學生教育投入的重視,應試教育發達,客觀上也導致水平也在提高。

第五,隨着高等教育與高中教育的普及,中高考不得不承擔更多的水平測試的職能,不得不部分水平化。當然,今年疫情備考不充分,讓各級考試在命題上也不得不適當下調了難度,這是今年的特殊情況。

這裏面有客觀原因,比如面對高中與高等教育普及化,不得不承擔把所有考生評測出來的職能。但也有一些非客觀原因,更值得深入探討。

首先就是把考試難度與負擔強掛鈎。

上世紀90年代以來,輿論與大眾對以高考為代表的升學考試口誅筆伐,無限上綱上線,指責大學教授也不會做什麼題之類的標題比比皆是。考試試題難度被認為直接影響甚至決定學生的負擔,試題難度大,壓力就大。在這種錯誤的輿論壓力下,各級選拔性考試不斷退讓,追求穩定,降低難度。中高考試題因此越來越趨於模式化,甚至固化,“萬年不變”的送分題越來越多,考基本智商的題比比皆是。中高考越來越像託福、雅思等水平化考試,越來越遠離選拔性考試。

這是近年來各類升學考試中值得注意的一個趨勢,其背後無非是一個荒唐的邏輯:試題難度與學生負擔成正比,為降低負擔而不斷降低難度。

其實,考試的難度與負擔之間沒有必然聯繫,這是一個淺顯的基本邏輯,基本道理。如果談到負擔,其實只與你考試的期望值相關聯。再簡單的考試,想考第一都是比較難的,再難的考試,想考零分都是很容易的,而非試題的難度。但遺憾的是,很多人把這個邏輯顛倒了。

這一現象,還與我們近年一些招生改革的思想有關,與倡導甚至照搬英美的招生錄取方式有關,推行選拔性考試水平化、等級化,試圖以水平測試破解應試教育難題。

不同的考試,其定位與目的,效果和作用是不同的,簡單從功能上來説,一種是水平考試,一種是選拔性考試。原則上講,水平考試難度相對較低,從測量角度看,區分度較低,是粗顆粒的,只是一個大致分層。但是選拔性測試不同,它更強調對優秀人才的區別與選拔,要求區分度更高,是細顆粒的。

我們所熟知的美國的各種考試多數是前者。美國“高考”SAT實際上相當於我們的高中學業水平測試,美國的“中考”SSAT類似我們初中學業水平測試,同樣,託福也是一種語言水平測試。這類水平測試在分數的計量上也是不同的,比如老SAT滿分為2400分時,即便再低,一般也不會低於1200分,想低於這個分,稀缺度和考2380分以上一樣難,因此經常有人開玩笑説:你如果SAT能考到1100,我就請你吃飯。

美國盛行的這種水平化考試,是與其錄取制度配套的,即水平考試作為一個基礎學術評價,學校在此基礎上綜合評價後招生錄取。這些成績是基礎,但不是唯一依據。

中國則不然。因為誠信等原因,最後不得不回到分數這個唯一的剛性依據上來,這時,盲目套用美國的水平測試,那幾乎是一場災難。人家用一個粗框架的水平測試作為一個評價基礎,我們卻需要把這個東西作為唯一,怎麼能不出問題?

近日江蘇文科第一名(嚴格講並非第一名),因為歷史科目B+無緣北大清華就是這個原因。其實按江蘇的規則,她無緣大部分的985高校,不止是清華北大。

2008年江蘇高考改革,考試上的基本模式就是選拔性考試(語數外)+水平測試。這一分裂的混搭組合,目的是降低分數的殘酷競爭,但卻造成了更多的混亂,不得不廢棄。

除此之外,我們的考試越來越簡單,還有一個潛在原因,搞“分數GDP”,讓多數考生與家長都有分數的獲得感,皆大歡喜。比如某市曾經在一年之間就讓高考分數平均分上漲了100分左右。

近年各地在“分數GDP”的競爭上也越來越激進,尤其是中考,幾乎一個比一個容易,無法區分。越來越多的人是高分考生,家長學生臉上都有光。這個做法很有點消滅薄弱校的做法,掛牌子,改名字,於是大家都名校,皆大歡喜。

如果這樣的做法是可行的,對人才選拔與培養有利,沒有什麼不可以,但遺憾的是,多數是適得其反。

考生的成績越來越高,表面上家長和孩子都皆大歡喜,豈不知害苦了教育。

首先,考試簡單化、水平化、模式化,大大降低了考試的區分度,完全破壞了選拔人才的功能,帶來了更激烈的分分計較。

我們雖然不斷推進招生改革,包括綜合素質評價,但因為誠信等種種現實困難原因,在公平強大的訴求下,綜合素質評價只能是“一參考”,最後升學考試多數還是要回到分數這把剛性的尺子上來。這時,分數之間的競爭更加激烈,已經不再是分分計較,而是零點幾分的計較。1分2分有區別嗎?當然沒有。破解分分計較的辦法,帶來的卻是更殘酷的零點幾分的計較。

更糟糕的是,考試越來越水平化,甚至固化,分數越來越高,區分度越來越低的分數,對於人才選拔的意義越來越小,尤其是對拔尖人才,甚至起反作用,選拔出的更多可能是中間人才,未必是頂尖人才。

這也導致一些名校不得不放棄依賴高考分數的選拔,越來越多地走特殊類型招生,希望通過其他尺子,彌補缺乏區分度的尺子。自主招生近年大行其道就是這個原因。

近年著名高校在浙江搞的三位一體,表面上是綜合評價,即60%是高考分數,10%是中學評價,30%是學校自己的評價。但核心還是需要靠高校自己的筆試與面試做一次再甄別,以選拔出最優秀的。

2019年,在清華大學三位一體測試考場,很多考生提前交卷,一個關鍵原因就是題目難度,考生自知沒戲,索性提前交卷準備下午其他學校的測試。有一個女生面對記者提問時説:真難,題型都沒有見過。其實,這句話可以反向理解:高考的題型與內容都是見過的。

近年各地高考狀元普遍不再來自當地名校,呈現全面分散化的現象,有人高興地認為這是優質教育資源均衡的結果,豈不知這是考試簡單化、水平化的結果。這種低難度,水平化甚至固化的測試,最後較量的是熟悉程度,是謹慎不出錯,拼的不是能力,而是不丟分。因此,更多的人都有可能勝出。

這種升學考試,最後褒獎的不全是最優秀的人,多數是最擅長刷題的人。對於極其優秀的學生,反而增加了大量無效負擔,為了幾分的區別,很多孩子不得不花上一年甚至更久的時間重複訓練,才能確保進入一個理想的學校。從這個角度上看,這種考試,恰恰是對優秀學生增加了無效負擔。

其次,與各級考試難度下降,考試模式化、固化相伴,在應試教育的現實狀況下,各地也出現了學生學業水平下降的新問題。

這方面最典型的案例,莫過於江蘇的2008年高考模式。2008年江蘇的高考考試改為語數外(不分文理)+水平(等級)測試。前面的還是選拔性考試,後面的測試則直接表述為A+,A等。這個方案的出發點非常理想,也很可愛。

這個方案引起各方非議只是一方面,比如今年所謂文科第一名無緣北大清華的結果。更糟糕的是,水平測試帶來江蘇考生在物理等等級測試科目上水平的大幅度下滑。

北京某著名大學對江蘇生源的長期監測表明,原來數學物理成績遙遙領先於全國,高居該校第一名的江蘇生源,2008年新高考後,數學物理成績下降顯著,尤其是物理,在實施新高考5年後,江蘇考生的物理成績在學校新生摸底測試中,從第一名跌至第19名。

其根本原因就是考試的模式,語數外不分文理,數學難度不得不降低,而後面的更徹底是非常粗顆粒的水平(等級)考試,難度大幅下降。考的簡單了、少了,學生學的就少了,導致江蘇考生在這些學科上的水平大幅度下滑。因此,該校近些年對於江蘇考生不再像以前那麼青睞了。

功利文化是瀰漫性的,一旦考試這個指揮棒簡單了,學的就必然少了,從這個角度説,從為國家人才培養的角度看,我們需要高度警惕,中高考考試水平化,簡單化,是否會帶來人才培養質量的普遍下降?

最後,如果説區分度降低,難以選拔出優秀人才還可忍受的話,那麼選拔性考試簡單化、水平化、模式化,則直接強化推動了應試教育的發展,這是我們堅決不能接受的。

一方面推動中高考等選拔性考試逐漸水平化,簡單化,另外一方面,為了追求所謂的平穩,命題不得不模式化,甚至固化,各地中高考所考核的知識點與題型大多連年保持不變,這幾乎等於考試試題三年早知道。對於理科科目,區別只是切入點與參數的變化。

要保證在這種考試中脱穎而出,關鍵在於不出錯,怎樣才能做到這一點?訓練,連續不斷的重複訓練,因為重複訓練是最有效的,這也就是全國瀰漫性的應試教育難以根除的重要原因之一。

我曾在某地一所重點中學看到一個班訓:作業按時交,必上211。這個班訓鮮活地反映了目前考試的特點或者説不足。考什麼,其實大家都知道,核心是紮實訓練,不出錯,因為這種重複訓練是有意義和有效的。

衡水中學等地方中學全面崛起,雖然有多種原因,但其中一個原因就在於這種考試模式,讓紮實的重複訓練有了重大意義。這可能是一些專家在批判考試難時始料未及的。

同時,區分度降低,也前所未有地強化了分數的價值,分分必爭成為一個普遍而現實的問題。即便是在北京,考生不足7萬人的情況下,一個高分分數段有幾十人甚至上百人比比皆是。

在一些考生大省,比較高的分數段1分動輒200-300百人,甚至近千人,而一所高校在當地招生量才有多少?反觀低分分數段,1分段往往只有幾個人。最後推動的只能是應試教育的加劇。

在我們還無法全面推行綜合素質評價,對於大多數人只能以考試成績為核心錄取依據的背景下,這種選拔性考試水平化、固化,恰恰強化了應試教育。畢竟,刷題是管用的,效果是明顯的,就如託福、GRE一樣。

中高考越來越容易,無意間也抬高了更多家長與考生的期望值,加劇教育的劇場效應。

中高考分數全面上漲虛高,表面上皆大歡喜,大家都收穫滿滿成就感、獲得感,但也誤導了很多的家長與學生,人是有區別的,尤其是中考虛高,導致很多家長與考生對自己做出誤判,無意間推升了教育的期望值。

中考分數幾乎沒有區分度的情況下,人大附中與其他中學的錄取分數幾乎沒有區別,於是讓很多家長誤以為自己孩子很優秀,一不留神沒準就能上北大清華,於是拼命上補習班,希望把最後一公里補上來,客觀上反而加劇了家長的期望,進而推動了教育的劇場效應。

因此,中高考難度加大,拉開差距後,一個積極的意義就是讓一部分家長與考生有清醒的認知,選擇適合自己的道路,而不是拼命補習、訓練,全部追名校。新加坡在這方面的做法給了我們很好的啓示,從小升初考試開始,就讓一批家長徹底放棄了精英道路的追求。

升學考試這種選拔性考試簡單化、水平化,在還不能全面推行綜合素質評價的背景下,對中國教育是弊大還是利大?在我看來,答案是明確的。

是時候採取措施予以糾正了。中高考試題要打破水平化,簡單化,甚至固化的傾向,加強區分度。尤其是打破固化的傾向,每年試題無論考核的知識點還是出題形式上,需要加大變化,最大程度減少重複率,讓所有人無試可應,反而可以最大程度降低應試教育,減輕學生負擔。

試想,如果試題難度加大,沒有了太多“萬年不變的題”,無試可應時,還會出現大面積應試嗎?大家都乖乖回頭去學習了,而不是刷題。

最後還想提醒,考試無論容易還是難,對所有考生都是公平的,所有的家長和學生都不必焦慮。

本文轉載自微信公眾號“陳志文觀察”。文章為作者獨立觀點,不代表芥末堆立場,轉載請聯繫原作者。

  • 教育
  • 高考
  • 考試

推廣: 芥末堆商務合作:010-5713 1145