原標題:陳沁:純數據分析,高考上一本或二本,畢業五年十年後收入差距多大
一本學校和二本學校畢業生,未來的就業會在多大程度上因學歷而拉開差距?換句話説,如果一個人本來可以讀一本,但是出於各種原因而讀了二本,那麼他/她未來的就業乃至人生會因此改變多少?
首先得承認,回答這個問題並不容易,因為:
我們沒辦法讓同樣的一個人經歷一遍一本,再經歷一次二本,然後讓這同一個人來述説兩者的差異;
直接用上了一本的一羣學生和上了二本的一羣學生比較,説前者的工作、收入都比後者好,所以一本好,這也不對。因為我們沒法確定他們的人生走向不同是由於學校差異帶來的,還是由於自身差異帶來的——畢竟兩者在高考考分上就有區別。
個體的比較和個例的舉例就更加沒有説服力了。
因此,這個問題需要我們使用RDD方法來研究。RDD中文為斷點回歸,即比較斷點兩側的情況,看有沒有出現突變。
對於高考來説,斷點回歸十分合適。首先,高考考分是連續的,從0分到750分,一分一檔;其次,高考考分具有一定隨機性,一個水平在500分左右的考生,在高考時勉強超過500分,和剛好低於500分的概率是差不多的。
由於連續性和隨機性這兩個性質,當兩個學生的分數只差1分時,我們很難斷定,這兩個學生誰會在未來的就業市場上表現更好。
除非,這一分剛好處於一本線上。
一本線上和一本線下,學生的錄取完全就是兩個流程。
線上1分的學生當然可能因為志願填報問題而落榜,到二本去。但總體來説,他/她還是有不少概率能讀一個一本學校——雖然專業可能並不理想。
但對於線下1分的學生,他/她可以選擇二本學校中的好專業,但幾乎沒有什麼就讀一本學校的機會了。
因此,由於一分的差距,把一羣並沒有本質差異的學生分成了兩組,一組在線上,一組在線下。如果此時這兩組學生的未來人生走向出現差異,那麼就可以説這個差異是由學校帶來的了。
一、一分之差帶來的工資差異有多少?
賈瑞雪、李宏彬在2017年的文章《The Value of Elite Education in China》首先對這個問題給出瞭解答。他們使用CCSS數據進行研究。
“中國大學生學習與發展追蹤研究”項目是清華大學教育研究院於2009年發起的全國性大學生學情調查。該項目由清華大學教育研究院史靜寰教授主持,在來自教育研究院、經管學院、社會學院等多個院系研究人員的積極參與和推動下,形成了一套以學生為中心、關注學習過程、全面考察學生的學習和未來發展的科學有效的研究工具。調查覆蓋從生源輸入,學習過程到就業出口的全口徑數據,力求全面準確地反映院校本科教育的質量和動態。截至2016年,累計已有147所高等院校參與了本項目調研。
上圖的紅色虛線代表每個學生當年高考時的一本分數線,橫軸表示的高考成績比一本線高出20分或者是低20分,左右兩圖的縱軸分別為工資水平或者對數工資水平。
從圖中可以看到,在虛線兩旁,工資水平出現了一個跳躍,這個跳躍的高度大約為122元工資,或者是6%的工資增長。
因此,如果高考提高1分,從一本線以下一分提升到一本線,這名學生在畢業時拿到的offer就會提高122元!
二、一本和二本,只是差122元嗎?
看到這裏你可能會想,只是122元,有什麼了不起呢?
的確,如果僅僅是122元的畢業工資提升,那麼可能確實不能説明一本比二本好多少。
但我們需要注意一點:達到了一本線,只是理論上讓你能進入一本院校,但並非一定能被錄取。比如志願沒有達到所填專業的分數線,又沒有服從調劑,或者是主動選擇了二本院校等情況都可能出現。
紅色虛線仍然代表一本線,縱軸代表能夠進入一本高校的概率。可以看到,虛線左邊進入一本的概率的不足5%,到右邊就立刻跳躍至20%左右。
雖然分數線左右導致進入一本的概率有一個顯著的跳躍,但遠非從0%到100%那樣直接,而是在一個幾十分的分數段內,有一個被錄取到一本院校“概率逐漸提升”的過程。前文的122元,與其説是“一本和二本的工資差距”,不如説是“考分高於一本線1分使一本錄取率提升15%帶來的工資差距”。
因此,122元,或者是6%,只是比較了一本院校錄取率為20%和錄取率不足5%的兩組學生的工資差異,低估了一本院校帶來的工資影響。
要估計一本院校的工資溢價,我們實際上需要估計的是:
這是一個二階段迴歸,首先用高出一本的分數迴歸是否錄取一本,取得其係數後再算出每一個分數被錄取一本的概率,再用此概率迴歸高出一本線的工資差異。
賈瑞雪等的論文算出,這個差異大概是30%-40%。或者説,700-1000元。這就是一本院校和二本院校的學生,在畢業時的工資差距。
三、這個工資差距,是來自個人能力,還是來自學校品牌?
到了這一步,讀者可能還會有疑問——一本院校和二本院校,由於學校品牌的差別,在畢業時當然存在工資差距。因為用人單位在招聘應屆畢業生時僅能通過學校的品牌來判斷個人的能力。
這確實是對的:畢業時的工資差異,並非來自個人能力的差異。賈瑞雪的論文發現,一本院校的畢業生工資更高,可能並不是因為他們能力更強。作者檢驗了這批學生的四級考試成績、計算機等級考試、註冊會計師考試等,發現在一本線上下的學生中:
英語四級考試成績,一本線上線下學生沒有差異;
計算機等級考試,一本線上線下學生沒有差異;
註冊會計師考試線上學生還要低於線下學生;
……
所以,一本學生在畢業時比二本學生領先的30%-40%的工資,更可能來自學校的品牌以及他帶來的更好的社會關係——比如更多的實習機會。因為即使一本學生有更好的個人能力,用人單位上也無法在簡歷上通過這類證書識別出來。
四、未來的差距,是擴大了,還是縮小了?
由此可見,一本和二本實際上有很大區別,但是未來呢?是不是隨着時間推移,學校的品牌的決定能力降低,此時決定工資的,應該是個人能力?也就是説,畢業後通過努力工作,能否彌補由學校品牌帶來的差距?
答案是,不能。不僅如此,大概率的情形是,差距不僅不會縮小,還會擴大。
上文全部引用了賈瑞雪的論文,他們使用的CCSS數據使得研究只能侷限於畢業當時的offer情況,卻不知未來會如何變化。但中國還有另一份數據詢問了高考情況,那就是CHIPs,中國家庭收入調查,全稱為China Household Income Projects。
2014年7-8月份,中國居民收入項目進行了第五輪全國範圍調查,主要收集了2013年全年的收入和支出信息,編號為CHIP2013。本輪調查得到國家自然科學基金資助和國家統計局的支持,由北京師範大學中國收入分配研究院聯合國內外專家共同完成。具體的調查過程由國家統計局城鄉一體化常規住户調查辦公室執行。
問卷中有這樣的問題,記錄了每一名受訪者的高考年份、類型、分數、地點。
我另外蒐集了從1998年至2018年所有年份各省文理綜合卷的一本分數線,很多年份已經很難收集,但一些較早年份,由於當時的全國高考試卷仍然統一,也呈現出了不少有趣的點,比如1999年是這樣的:
言歸正傳。
我們先使用CCSS的部分數據,用同樣的方法重複了賈瑞雪的論文。將帶寬擴大後,顯示如下:
上圖我將帶寬擴大到了上下200分,此時一本學校和二本學校的工資差距,用斷點回歸方法可以算出約6%的差距,可以理解為兩條直線在一本線上的截距之差。若是使用二階段迴歸,結果為30%。兩個計算均與賈瑞雪論文得出類似結果。
上圖是剛畢業時的工資差異,用CHIPs數據,我們就更加自由一些。CHIPs可用的兩次調查發生在2008年和2014年,有12790名被訪者曾經參加過高考,其中6619名被訪者的高考時間發生在1998年之後,可以和我之前蒐集到的1998年之後的分數線匹配起來。
在這六千多名在1998年之後參加高考的被訪者中,有2268名被訪者,在調查當年已經畢業了五年以上。使用這部分被訪者的高考數據和工資數據,我可以識別出畢業五年後的工資差異,結果如下:
即使用肉眼也能清晰地看到,一本和二本之間的斷點,比剛畢業時擴大了。
由於CHIPs樣本遠少於CCSS,因此上圖的點較為分散,但上圖的斷點回歸是非常顯著的:從二本到一本,兩者之間的工資差距為24%。如果用二階段迴歸,先估計進入一本院校的概率,再用概率迴歸工資,則一本和二本的差距高達90%。
同時我們從上圖還可以看到一個可怕的現象:
只有一本線的右邊,才存在着“工資隨着高考考分提升”的趨勢。在一本線的左邊,從比一本低200分,一直到一本線附近的這麼大區間裏,人們的工資都是差不多的。
雖然樣本進一步變得稀疏,但一本線上下的差距也變得更大、更顯著了。
簡單總結如下:
使用斷點回歸觀察一本線相鄰的工資差距——剛畢業時,兩者的差距是6%;畢業五年後,差距擴大到24%;十年後,差距擴大到34%。
使用二階段迴歸考慮進入一本院校的概率後估計一本院校帶來工資差異——剛畢業時,一本學生比二本學生工資高出30%-40%。畢業五年後,這個差距擴大到了90%。十年後,差距擴大到110%。
更重要的是,考試成績和工資的關係,只在一本線以上存在。只要你在一本線以下,不管是差一點點就到一本線,還是差200分才到一本線,五年、十年後,你們都會踩在同一條終點線上。
因此,不要相信“一本和二本沒什麼區別”之類的安慰。如果你的水平正處於一本和二本之間,那麼還差十天,好好複習,考好高考,考上一本,才是你現在最應該完成的任務。高考一考定終身,一分的差距,決定了未來十多年的兩個世界,此言非虛。