大學排名 :一家快倒閉的二流雜誌搞出來的自救專案

圖片來源網路

這個故事開始於1983年,美國一家瀕臨停刊的雜誌《美國新聞》決定開展一個規模龐大的專案:評估全美1800所學院和大學,按優秀度為這些學校做一個排名。如果進展順利,這個專案的成果會成為一個有用的工具,可以用於指導數百萬年輕人做好人生中第一個重大的選擇。對於許多人來說,這個選擇將決定他們的職業道路、終身的好友圈,通常還包括終身伴侶。此外,雜誌編輯也希望這個大學排名專案能帶動雜誌銷量——沒準在推出大學排名的那一週裡,《美國新聞》的銷量能追上《時代》和《新聞週刊》呢!

但是,要基於什麼資料進行大學排名呢?起初,《美國新聞》的工作人員完全依靠他們寄給各大學校長的調查問卷所得到的反饋結果進行評分。結果,斯坦福大學位居全美綜合性大學之首,阿默斯特學院則是排名第一的文科學院。排名結果雖然很受讀者歡迎,但也令很多大學的校領導非常憤怒。雜誌社收到了排山倒海般的投訴,內容都是控訴排名結果有失公正的。許多大學的校長、在校學生和已畢業的校友堅持認為自己的學校應該獲得更高的排名,雜誌社應該再去仔細研究一下有關的資料。

接下來的幾年,《美國新聞》的編輯一直在思考他們具體可以測量什麼資料。許多模型誕生了,但其中大量的評估因素僅僅來自直覺。模型確立的過程並不嚴謹,統計分析也缺少根據,模型建立的依據僅僅是人們憑空想象的對教育而言最重要的因素,然後,去尋找可以測量的相關變數,最後隨意地在公式中賦予每個變數一定的權重,模型就完成了。

在大部分領域,模型確立的過程通常是比較嚴謹的。比如,農業學科的研究者會比較投入和產出。然後,他們就可以按照目標,比如一定的成本、口感或者營養價值等進行下一步的試驗和最佳化。但是,《美國新聞》的編輯所做的是“教育優秀度”排名,這是比糧食成本或者每個麥粒的蛋白質含量更加抽象、模糊的價值。這些編輯沒有直接的方法來量化4年的大學學習過程是如何影響某一個學生的,更不用說數千萬個學生了。他們不可能測量一個學生在4年大學生活中的學習、幸福、信心、友誼等全部方面。美國前總統林登·約翰遜對高等教育的定位是:“高等教育是深化自我實現、擴大個人生產力和增加個人回報的途徑”,但不管是其中的哪一條都不適合放在大學排名模型中。

《美國新聞》的編輯只是挑選了一些和評估目標看似相關的變數。他們研究了高中生的SAT成績、學校的學生教師比和錄取率。他們統計了順利進入大二的新生佔總數的百分比和順利畢業的學生佔總數的百分比。他們計算仍在世的已畢業校友為母校捐款的人數佔總數的百分比,依據是他們給母校捐款很可能表明他們喜歡母校的教育。排名結果中佔3/4權重的分數都來自一種演算法,這種演算法就包含以上那些變數;另外佔1/4權重的分數則來自全美各地的大學校長的主觀評價。

當這一排名發展成全美標準時,

惡性迴圈出現了

《美國新聞》第一次依據資料確定的大學排名於1988年出爐,當這一排名發展成全美標準時,惡性迴圈出現了。排名會自行鞏固,如果一所大學在《美國新聞》所釋出的排名中名次靠後,它的聲譽就會下降,生源情況就會惡化。優秀的學生會避開這所大學,優秀的教授也一樣。已畢業的校友將減少捐款。由此,這所學校的排名就會繼續下跌。簡單來說,排名決定了大學的命運。

以前,大學有各種方法可以宣揚學校教育的成功,許多是靠傳聞逸事。例如,某些教授得到了眾多學生的一致好評;一些學生在畢業後走上了傑出的職業之路,成為外交官或者成功的企業家;還有一些學生出版了一流的小說。這些正面事蹟經由口口相傳廣為人知,學校的聲譽也由此提升。但是,麥卡利斯特學院就比裡德學院好嗎?或者艾奧瓦大學就比伊利諾伊大學好嗎?這很難說。不同的大學就像不同型別的音樂或者不同的飲食習慣,對於某所大學的評價眾說紛紜,好壞兩方面都可以列出充分的理由。而現在,大學的整體聲譽被一組數字蒙上了陰影。

如果你站在大學校長的角度思考這件事情,你會發現大學排名其實是很糟糕的。毫無疑問,絕大多數校長珍惜自己的大學經歷,因為從某種程度上來說,正是大學經歷激勵他們攀登學術階梯,成為一所大學的校長。但是現在,這些正處在事業高峰期的校長需要投入巨大的精力提高與學校教育優秀度有關的15個考核項的分數,而這15個考核項是由一個二流雜誌社的一組編輯定義的。他們就好像又回到了學生時代,每天都在祈求老師給高分。如果《美國新聞》發表的大學排名只在小範圍內流行,倒也不會造成什麼麻煩。但是,這個排名的影響力發展迅速,很快成為一個全美標準。教育界一下子緊張起來,迅速給大學校長和學生都設定了嚴格的任務清單。《美國新聞》的大學排名模型規模巨大,造成了大範圍的損害,導致了幾乎是無盡的惡性迴圈。

一些大學的校領導想盡一切辦法提高排名。貝勒大學設立獎金激勵大一新生再次參加SAT考試,希望再考一次能提高他們的成績以及貝勒大學的排名。有些名校,包括賓夕法尼亞州的巴克內爾大學和加利福尼亞州的麥肯納學院,則給《美國新聞》反饋了假資料,誇大了其學校新生的入學分數。2011年,位於紐約的愛納學院承認其學校教師幾乎捏造了所有的資料:考試成績、錄取率和畢業率、新生保留率、師生比和校友捐贈額。但謊言起效了,至少在一段時間之內。據《美國新聞》估算,假資料將愛納學院從東北地區大學排名第 50名提升至第30名。

更多的校領導則試圖尋找一種更常規的方式來提高他們的學校排名——努力提升學校在影響最終分數的每一個變數上的表現。他們可能會認為這是效率最高的資源利用方式。畢竟,只要他們努力去迎合《美國新聞》的模型,得到更高的排名,他們就能籌集到更多的資金,吸引來更優秀的學生和教授,然後進一步提高排名。除此之外,還有別的選擇嗎?

大學為了排名展開“軍備競賽”,

但排名模型把成本排除在演算法外

羅伯特·莫爾斯從1976年起就在《美國新聞》雜誌社工作,他是這個大學排名專案的組織者,他在採訪中稱進行大學排名有利於推動大學制定更有意義的目標。如果他們能因此致力於提高畢業率或者把學生分成更小的班級上課以提高教學效果,那就說明排名是件好事情。他承認雜誌社拿不到與大學教育優秀度最相關的資料,即每個學校學生的學習內容。但是,基於替代變數建立的 《美國新聞》大學排名模型也足夠反映問題了。

但是,當你基於替代變數建立模型時,鑽模型的漏洞會變得容易很多。這是因為替代變數比起它所代表的複雜事實更容易操控。舉個例子,假設有一個網站要聘用一個社交媒體專家,人事經理決定選定一個變數——重點考慮推特粉絲數排名靠前的應聘者。推特粉絲數是社交媒體參與度的標誌之一,沒錯吧?但是想象一下,應聘者很快就會無所不用其極地增加推特粉絲。有人會花費19.95美元直接 “購買”大量由機器操控的粉絲。因為人們鑽了招聘系統的漏洞,替代變數失去了效力。

在《美國新聞》大學排名事件中,從高中畢業生到大學校友再到公司的人力資源部,人們很快接受了該排名是大學教育質量的一個體現。因此,各個大學只能選擇配合,他們不得不努力提高排名所涉及的每一個考核項的分數。其實,許多學校最焦慮的是那不能控制的佔排名結果1/4權重的因素,即聲譽分數,來自各個大學、學院的校領導給出的問卷調查反饋。

2008年,沃思堡市的得克薩斯基督教大學排名猛降。三年前,該校的名次是 97,之後三年名次遞降為105、108和113。該校的校友和支持者為此感到很憤怒,校長維克多·博西尼也因此陷入尷尬境地。他堅稱得克薩斯基督教大學在每個指標上的表現都在進步,“我們的新生保留率在提高,我們的籌款等所有方面都在改善”。

博西尼的申辯有兩個問題。首先,《美國新聞》排名模型並不是對各個大學進行孤立的判斷。即使是各指標分數均有所提升的學校在排名中也會落後於其他分數提升得更快的學校。用學術術語來說,《美國新聞》的評估模型是一種分佈模型。這導致了一場學校間的“軍備競賽”。另一個問題是,得克薩斯基督教大學無法控制佔1/4權重的聲譽分數。招生主任雷蒙德·布朗指出,聲譽是模型中權重最大的變數,“這很荒謬,因為它完全是主觀的”。新生招生主管威斯·瓦戈納則指出,為了提高聲譽分數,各大學都在紛紛為自己打廣告。

儘管如此,得克薩斯基督教大學仍然決定著手提升那可控的佔 3/4權重的分數。這所大學發起了一個2.5億美元的籌款活動。到2009年,學校已募集到4.34億美元,遠遠超過目標額度。由於籌款額是排名的指標之一,僅此一項成績就提升了排名。得克薩斯基督教大學花費了其中的大部分資金用於校園設施改善,其中1億美元用於興建中央商場和學生活動中心,努力讓得克薩斯基督教大學的校園看上去更具吸引力。這些做法本身沒有什麼不對,但其初衷是迎合《美國新聞》的排名模型。

也許更重要的是,得克薩斯基督教大學興建了一個其時最高水準的體育訓練場館,並將大量的資源投入到足球專案之中。在接下來的幾年裡,得克薩斯基督教大學的角蛙足球隊成為國家強隊。2010年,他們在玫瑰杯足球賽中打敗了老牌強隊威斯康星隊,取得了全美總冠軍。

這次勝利為得克薩斯基督教大學帶來了所謂的“弗洛特 爾 效 應 ”。1984年,在一場極為精彩的大學橄欖球比賽上,波士頓大學隊的四分衛道格·弗洛特爾在最後一秒完成了一個扭轉敗局的超長距傳球,打敗了邁阿密大學隊。弗洛特爾由此成為一個傳奇。這場比賽結束後的兩年內,波士頓大學的大學申請率上漲了30%。喬治城大學也曾擁有帶來過同樣的宣傳效果的傳奇。該校由帕特里克·尤因帶領的籃球隊三次打進全美錦標賽。看來,贏得體育比賽是吸引學生申請某所大學的關鍵因素。當大批體校的高三學生在電視上觀看大學體育比賽時,球隊實力強勁的學校對他們形成了極大的吸引力。這些學生會為自己是該校的學生、身著寫著該校校名的隊服而感到驕傲。這些大學接到的入學申請因此暴漲。隨著更多的學生申請入學,招生處就可以提高入學門檻,以提高大學新生的SAT平均分,而這有助於提高大學排名。另外,學校拒絕的申請學生越多,其錄取率就越低,對排名就越有利。

得克薩斯基督教大學的策略奏效了。到2013年,該大學已成為得克薩斯州學生選擇度排名第二的大學,排在第一的是著名的休斯敦萊斯大學。這一年,得克薩斯基督教大學的新生高考和入學考試平均成績均達到史上最高水平,其在全美的排名也因此大幅上升。2015年,該校全美排名 76,也就是說,僅用了7年時間,該校就上升了37個名次。

現在,我們終於發現《美國新聞》大學排名模型最大的缺陷是什麼了。我們不能說《美國新聞》的編輯為評判“教育優秀度”選擇的替代變數是無效的,但他們犯下的更大的錯誤來自他們沒有納入考慮的變數:學雜費、學生助學金。這些變數被該排名模型遺漏了。

這引出了我們將會頻繁討論的一個關鍵問題:建模者的目標是什麼?在大學排名這個案例裡,你需要站在1988年《美國新聞》編輯們的角度來考慮。當他們在建立第一個統計模型的時候,他們怎麼知道這一模型是否有效?首先,如果模型能反映一些已有定論的大學排名,這就表明其有一定的可信度。比如,如果哈佛大學、斯坦福大學、普林斯頓大學和耶魯大學在大學排名模型中位居前列,這就在一定程度上證實了 《美國新聞》編輯設計出的大學排名模型是有效的。而要建立這樣一個模型,他們只需要去研究那些一流高校,思考這些大學的特殊之處是什麼就可以了。優秀大學的共同點是什麼?這些學校與其隔壁鎮的保底學校差距何在?他們發現:優秀大學的新生SAT成績都很高,而且絕大部分都能順利畢業;已畢業的校友都很有錢,會不斷給學校捐款;等等。就這樣,《美國新聞》的大學排名專案組透過分析名牌大學的優勢,建立了一個測量教育優秀度的評估指標體系。

現在,如果該專案組將教育成本納入演算法,則其模型輸出也許會發生奇怪的變化——學費便宜的大學很可能因此闖入優秀大學之列,而這一結果將遭到廣泛的質疑。由於公眾可能會把 《美國新聞》最終公佈的大學排名看得特別重要,因此採取保守、常規的演算法,保證一流大學位於排名輸出結果的前列,是一種更安全的做法。當然,高成本也許正是優秀的代價,這也不是沒道理。

《美國新聞》的排名模型把成本排除在演算法外,這就好像是給大學校長們遞了一本鍍金支票簿。後者要遵循的唯一指令,就是最大限度地提高15個考核指標的評分,而降低成本則不在其列。事實上,提高學費反而能讓他們有更多的資源用於提升考核專案的表現。

從此,學費一路飆升。從1985—2013年,高等教育的學費上漲了5倍以上,差不多是通貨膨脹率的4倍。為了吸引頂尖的學生,各大學都像得克薩斯基督教大學一樣,紛紛開始大力投入校園基礎建設,建造有玻璃牆的學生中心、豪華的宿舍,以及帶攀巖牆和漩渦浴缸的健身房等。從表面來看,這對學生來說是好事,這些設施可以豐富他們的大學體驗——前提是他們不需要以助學貸款的形式承擔這些費用,償還助學貸款的壓力可能會跟隨學生幾十年的時間。不過我們不能把一切都歸咎於《美國新聞》的大學排名。我們整個社會不僅認同了大學教育是必不可少的這一觀念,而且欣然接受了排名靠前的學校的文憑能幫助學生快速進入特權階層這一事實。《美國新聞》的排名模型以由此而生的恐懼和焦慮為養分,成長為一個龐然大物。排名模型有力地刺激了各方在教育上的不斷投資,而飆升的學費則被忽視了。

像管理投資組合一樣管理著學生

出於提升排名名次的需要,各個大學就像管理投資組合一樣管理著自己的學生。這在大資料領域裡很常見,小到廣告業大到政治領域都是如此。在校領導看來,每一個準大學生都代表著一組資產和一兩項債務。比如,一名高中生在體育賽事上的優秀表現就被視為一種資產,但同時其成績可能處於中下游水平,後者就是債務。他可能還需要申請助學金,這又是一項債務。為了平衡投資組合,他們應該發掘其他能自費上學並且成績優秀的考生。但是那些理想考生即使被錄取了也可能會選擇去其他更好的學校。這也是一個必須要量化的風險。鑑於整個評估體系非常複雜,為了“最佳化招生”,教育諮詢產業興起了。

教育諮詢公司諾埃爾-萊維茨開發了一個被 稱 為 “預 告 ”的預測性分析軟體包。該軟體包允許招生老師根據地理位置、性別、種族、研究領域、學術地位及“任何其他特徵”對準大學生的情況進行評估。另一個名叫“定位學生”的諮詢機構則致力於收集、買賣相關資料以幫助大學客戶找到最適合錄取的學生人選,包括可以支付全額學費的學生,以及可能有資格獲得校外獎學金的學生。就這個意義而言,學習障礙對於大學錄取可能反而是個優勢。

所有這些都發生在這個以《美國新聞》大學排名為中心的巨大的生態系統裡,排名模型實際上充當了系統內部最高法的角色。如果《美國新聞》的編輯重新安排模型中部分替代變數的權重,比如降低考試成績的權重,或者增加畢業率的權重,則整個教育生態系統就要重新適應新的法則。這一改變將波及諮詢公司、高中的升學指導部門,以及所有的學生。

2010年,《美國新聞》雜誌停刊了。但是整個排名產業未受絲毫影響,且繼續發展壯大,排名延伸到了醫學院、牙科學校、文學和工學研究生院,甚至高中。 隨著排名產業的發展,鑽模型漏洞的手段也越發豐富。2014年的《美國新聞》全球大學排名中,沙烏地阿拉伯的阿卜杜勒阿齊茲國王大學的數學系排名第七,僅次於哈佛。然而該校的數學系僅成立了兩年,沒人知道它是如何一下子躍升至全球前10,甚至超過了劍橋大學和麻省理工學院的數學系的。

伯克利大學的電腦生物專家利奧·帕赫特研究了這個問題。他發現,KAU和論文引用次數極高的很多數學家進行了接觸,並以7.2萬美元的年薪聘請他們擔當該校的客座教授。根據帕赫特找到的招募信,該合作協議規定這些數學家每年必須在沙烏地阿拉伯工作三週。大學將承擔他們的商務艙機票,安排他們入住五星級賓館。可以想見,他們在沙烏地阿拉伯的工作為學校增加了價值。但更關鍵的是,該大學還要求這些數學家將他們記錄在湯森路透學術引用網站上的通訊地址改為KAU,而這正是《美國新聞》排名模型中的一項關鍵參考因素。這意味著,KAU可以宣告他們的眾多新任客座教授的學術論文和專著都是他們的成果。由於論文引用次數是排名模型演算法裡的一個重要參考資料,KAU因此排名飆升。

排名模型生產的惡性迴圈及其引起的廣泛焦慮,也導致了整個升學輔導教育產業的蓬勃發展。一個叫“名校錄取”的教育公司推出了一個為期4天的“大學申請訓練營”培訓專案,收費高達1.6萬美元。在這期間,這些高二學生將學習如何寫申請書,學習如何“拿下”面試,建立“活動列表”總結自己得過的所有獎項和參加過的所有體育運動、社團活動及社群志願服務,因為這些都是大學招生辦關注的要素。

教育公司的專業人士瞭解每個學校的招生模型,所以他們知道怎樣讓一個準大學生被納入其目標學校的“投資組合”之中。美國加州星騰科國際教育集團的創始人馬振翼在教育產業中把市場分析法發揮到了極致。他用自己開發的模型評估準大學生,計算他們被目標院校錄取的可能性。他對《彭博商業週刊》的記者表示,假設一個美國高中生的平均學分績點 為 3.8,SAT成 績 為2000分,課外活動時間為800小時,那麼他被紐約大學錄取的機率為20.4%,被南加州大學錄取的機率為28.1%。然後,星騰科將提供一份有擔保的建議組合。如果這個學生接受了諮詢公司的建議輔導並最終成功被紐約大學錄取,則該學生就需向諮詢公司支付25931美元,如果他最終成功被南加州大學錄取,則需要支付18826美元。如果他的申請被兩個學校都拒絕了,那麼諮詢公司將不收取任何費用。

大學排名 :一家快倒閉的二流雜誌搞出來的自救專案

每個學生都是一個“投資組合”

主要受害者仍然是美國的大多數

每所大學的招生模型全部或者至少一部分來源於《美國新聞》的大學排名模型。這就為像馬振翼這樣的專業諮詢人士創造了巨大的商機,透過培養其在各個大學的人脈以獲取第一手資訊或者逆向推導各個學校的招生模型演算法,他們破解了絕大部分學校的招生模型。

當然,主要受害者仍然是美國的大多數,即窮人和中產階層,他們沒有那麼多錢可以花在課程和諮詢公司上。他們錯失了珍貴的內部資訊。結果是,教育體系偏離窮人和中產階層,將他們推向貧窮之路,進一步加劇了社會階層固化。

但是,即使是那些想盡辦法進入了名牌大學的學生也並不是贏家。大學招生制度只對少數人而言是有利可圖的,且根本沒有任何教育價值,只不過是以某種新奇的方式將一群18歲的孩子重新排序分類。在備考階段,掌握更多的籃球技巧或者在專業輔導人員的幫助下寫出符合目標大學標準的申請書並不能讓他們掌握真正有意義的技能。更不用說很多人都是靠矇混過關的。所有這些學生,不管是來自富人階級還是來自工人階級,都被培訓成要去適應一臺巨大的機器。

那麼,有什麼解決辦法嗎?在奧巴馬總統的第二任期內,他提出了一個新的大學排名模型,比《美國新聞》的大學排名模型更符合佔全美大多數人的利益。他的次級目標是削弱營利性大學的影響力。奧巴馬的想法是將大學排名系統與一組不同的指標聯絡起來,這些指標包括負擔能力、貧困學生和少數族裔學生所佔比例以及學生畢業後的就業情況。和《美國新聞》的排名模型一樣,該模型也會考慮畢業率。如果某所大學在這些指標上的表現低於最低標準,它就會被踢出每年價值1.8億美元的聯邦助學貸款市場。

奧巴馬的建模目標聽起來很有價值,但是每一個排名模型都有漏洞可鑽。而一旦被鑽了空子,模型就會產生新一輪的惡性迴圈以及大量意料之外的有害後果。舉例來說,提高畢業率很簡單,只需降低畢業要求就可以了。許多學生無法透過數學、科學專業課、外語這幾門課的考試,那麼放寬這方面的要求,這樣更多的學生就能畢業了。但是,如果我們的教育體系的目標是培養更多的科學家和技術人員,那麼這種做法豈不是很諷刺?提高畢業生的收入水平也很容易辦到。所有大學要做的就是減少文科專業,撤掉教育系和社會服務系,因為教師和社會工作者掙的錢沒有工程師、化學家和計算機科學家多。

“在畢業後9個月內就業的畢業生”數量也可以造假。《紐約時報》2011年的一份報告針對法學院做了一項調查,該報告評估了各個大學的法學院對畢業生的就業安置能力。調查顯示,假如一位肩負15萬美元學生貸款的法學院畢業生只找到了一個在咖啡店打工的工作,那麼一些無良的法學院會把這個學生也計入就業人數。另一些學校更過分,在 9個月的期限即將截止之時,對於那些還沒找到工作的畢業生,學校就僱用他們在學校做小時工,並將其計為就業。還有學校向畢業不久的校友發出調查,並將所有沒有回覆的人都歸為“就業”。

或許,奧巴馬政府沒能拿出一個經過重新調整的排名系統也是好事。大學校長強烈抵制新的排名系統。畢竟,他們多年來一直是照著符合 《美國新聞》的排名模型的方向努力的。奧巴馬提出的新排名模型涉及畢業率、班級人數、畢業生就業安置情況和收入水平等其他變數,若嚴格按照指標標準評估各大學,其得出的評分將嚴重損害眾多大學的排名和聲譽。

所以,政府最終做出了讓步。教育部沒有將大學重新排名,而是把大量的調查資料公佈在網站上。這樣一來,學生就可以自行查詢自己關心的指標,包括班級人數、畢業率以及應屆畢業生的平均負債額等。他們無須再去了解任何統計法或者變數的權重。就像一個旅遊網站一樣,現在,每一個人可以自行制定個人的模型。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 8533 字。

轉載請註明: 大學排名 :一家快倒閉的二流雜誌搞出來的自救專案 - 楠木軒