別再SOTA了，那叫“微調”！Science發文炮轟論文灌水

　　金磊發自凹非寺

　　量子位報道 | 公眾號 QbitAI

　　AI算法的發展，真有那麼迅猛嗎？

　　為了一探究竟，來自MIT的研究人員，便對81種AI算法做了橫測，結果令人大跌眼鏡：

　　沒有明確證據表明，這些算法在10年內，對任務效果有明顯改善。

　　針對類似的問題，Science最近也發文表示：

　　人工智能在某些領域的進步引人注目，但這並不是真正的進步。

　　那麼，這到底是怎麼一回事？

　　“是微調，不是核心創新”

　　MIT研究人員橫測的對象，是81種剪枝算法。

　　這類算法簡單來説，就是對神經網絡的連接做“修修剪剪”，以此來提高效率。

　　然而，這種算法的發展現狀，正如Science發文作者Matthew Hutson所説：

　　很多科研工作者就在此之上，做了些許“微調”，然後就宣稱自己的算法具有優勢。

　　因此，MIT的研究人員便對這些算法做了元分析，還提出了一種框架——ShrinkBench，用來促進剪枝算法的標準化評估。

　　真正的好算法，需要經得起考驗，那麼結果又如何呢？

　　第一輪考驗：剪枝 vs 架構

　　研究人員基於ImageNet，繪製了剪枝後模型的準確率和壓縮/加速水平，以及沒有做過剪枝、不同架構的相同指標，結果如下圖所示。

　　不難看出，一個給定架構經過剪枝後，可以改善其時間/空間與精度之間的權衡，有時候還可以提高精度。

　　但剪枝的效果，通常不如換個架構效果來得好。

　　第二輪考驗：“同行”算法比較

　　這一維度的考慮，是因為研究人員發現，許多工作都高舉“SOTA”旗幟，然而比較的對象卻不全。

　　很明顯的現象就是，缺少與2010年之前提出的算法的比較，甚至都沒有跟其它號稱SOTA的算法做對比，如下圖所示。

　　第三輪考驗：數據集和架構的組合

　　在81篇論文中，ImageNet和VGG-16的組合最為常見，並且，在前六種最常見的組合中，有三種涉及MNIST。

　　但MNIST與其它主流圖像分類數據集有很大的區別：它的圖像是灰度的，大部分是由0組成，用簡單的模型進行分類，準確率就可以達到99%以上。

　　第四輪考驗：度量指標

　　還有五花八門的度量指標，啥也不説了，直接上圖。

　　當然，還有諸如數據預處理、調參策略等一系列問題，都會導致結果的不同。

　　研究一作Davis Blalock表示：

　　這些改進都是所謂的“微調”，而不是科研人員聲稱的“核心創新”，甚至有些改進方法可能根本就不存在。

　　於是乎，MIT的研究人員便開發了一套方便開發、標準化評價神經網絡的剪枝方法。

　　ShrinkBench提供了標準化和可擴展的功能，可以用於訓練、剪枝、微調、計算度量和繪圖，而且都是使用標準化的預訓練模型和數據集。

　　正如另一位作者John Guttag所説：

　　如果你不能衡量某種東西，就很難讓它往好的方向發展。

　　好了，現在要是再想在剪枝算法上，稍微搞個小進展就水一篇論文，可能不再那麼容易了。

　　Science發文炮轟水論文

　　最近，Science也針對“水論文”一事發表文章，認為人工智能領域中的許多分支，其發展都是不穩定的：

　　2019年，對搜索引擎中使用的信息檢索算法進行的一項元分析，得出了一個“高水位線”(high-water mark)，然而，它早在2009年就有了；

　　同樣是2019年，另外一項研究復現了7個神經網絡推薦系統，結果，其中6個系統的表現，還沒有多年前開發的更簡單的非神經網絡算法好；

　　今年2月，卡內基梅隆大學的計算機科學家Zico Kolter在arXiv發表論文，他發現早期的對抗訓練方法PGD，只需要用簡單的小技巧增強一下，就能達到目前所謂更新、更復雜方法的效果；

　　今年3月，康奈爾大學的計算機科學家Kevin Musgrave，在arXiv上發表了一篇論文研究了損失函數，在一項涉及圖像檢索的任務中，他對其中十幾個算法進行了平等的比較，結果發現，與這些科研工作者的説辭恰巧相反，自2006年以來，準確率就沒有提高過。

　　正如Musgrave表示：

　　炒作浪潮一直存在。

　　反觀那些經久不衰的算法，像LSTM，自1997年被提出後，在語言翻譯任務中取得了重大突破。

　　如果LSTM得到適當的訓練，它的性能就能和20年後(現在)的算法相當。

　　類似的還有像2014年提出的GAN，大幅提高了生成圖像的能力。在2018年的一篇報告稱，只要有足夠的計算量，原有的GAN方法可以與後來的方法相媲美。

　　對此，Kolter認為，研究人員應當熱衷於開創全新的算法，讓這個新算法達到SOTA效果，而不是對現有算法做調整。

　　那麼，如今這種論文灌水背後的原因，又是什麼呢？

　　其中一個因素，便是MIT研究人員所指出的評估標準問題——數據集不同、調整方法不同、性能指標和基線都不同，這種比較是不可行的。

　　而另外一個原因，便是AI領域的爆炸性增長，論文數量遠超有經驗的審稿人數，評審人員應當堅持跟一個合理、科學的基準，做更好的比較。

　　比論文灌水更可怕的，是造假

　　以為學術亂象只有這些？

　　不，還有一股“造假風”。

　　5月20日，國外網友便曝出了一個學術造假大事件：

　　8篇文章，不同作者，不同醫院，不同癌症種類，不同蛋白表達，愣是完全一樣的結果，發了8篇論文。

　　UAB醫學院糖尿病中心博士後研究員、營養學博士，微博網友“晨光us”對此表示：

　　如此喪心病狂的造假，簡直讓人看得窒息。

　　然而，更令人悲哀的是，論文作者全部來自中國……

　　而且從文章署名來看，從一線醫生到主任副主任醫師、醫院副院長，還有多篇是國家自然科學基金資助。

　　如此造假，簡直不簡單。

　　網友也表示：

　　突破了我對學術造假的所有認知。

　　無獨有偶，前不久在知乎中還曝出南京郵電大學教授，三年半發表300篇IEEE論文，一時成為熱議話題。

　　其弟子“黃同學”論文造假、冒充北大學生，也一併上了熱搜。

　　……

　　如此學術亂象，你怎麼看？

外媒：封鎖措施使歐洲逾300萬人避免死於新冠病毒

發佈於: 綜合2020-06-14標籤: 封鎖措施新冠病毒研究人員帝國理工學院

外媒稱，一項研究估計，在歐洲，封鎖措施使逾300萬人免於死於新型冠狀病毒。據英國廣播公司6月8日報道，倫敦帝國理工學院的研究小組説，如果沒有封鎖，“死亡人數將是巨大的”。但他們警告説，目前只有一

運動10分鐘左右就能讓身體近10000個分子大變樣

發佈於: 健康2020-06-14標籤: 分鐘左右就能研究人員胰島素抵抗

生命在於運動。我們都知道運動有益健康，例如能提高免疫力、增強心肺功能、改善認知能力以及調節身體代謝水平等。除了上述好處之外，急性運動測試之後，檢測身體的各項指標，還可以發現一些隱匿在我們身上的疾病。

每隻放養寵物貓，平均每年殺死186只小動物

發佈於: 休閒2020-06-14標籤: 平均每只小動物哺乳動物研究人員

文丨學術頭條在很多人的眼裏，貓已被人類馴化，也一直是可愛、活潑的印象，有時還特別黏人，但實際上，貓從未被人類馴化。他們喜歡特立獨行，保留着極強的狩獵習性，當它們温飽無憂出現在野外時，骨子裏的野性立刻釋

別想太多！研究發現：長期消極思維增加痴呆風險

發佈於: 科技2020-06-14標籤: 研究發現別想太多研究人員每日科學

參考消息網6月13日報道據美國每日科學網站6月7日報道，英國倫敦大學學院帶頭開展的一項新研究顯示，長期沉浸於消極思維模式可能提高患阿爾茨海默病的風險。這項針對55歲以上人羣的研究發表在美國《阿爾茨海默

中國科學家發現穿越億年的“翼龍伊甸園”，3D胚胎化石首現

發佈於: 科技2020-06-14標籤: 翼龍科學家發現研究人員

核心提示：穿越一億多年，一塊鑲嵌着215枚翼龍蛋、3.28平方米大的砂岩展現在世人面前。　　中國科學院古脊椎動物與古人類研究所、中國科學院大學汪筱林研究員帶領着科考隊在新疆哈密考察十餘年，在戈壁發現了

美媒：研究人員稱新冠病毒很可能已“突變”，更容易感染人類細胞

發佈於: 科技2020-06-14標籤: 美媒更容易研究人員世界衞生組織

【環球網報道見習記者崔妍】“在我們使用的細胞培養系統中，帶有這種突變的病毒比沒有突變的病毒具有更強的傳染性。”據美國有線電視新聞網（CNN）最新消息，佛羅里達州克里普斯研究所的研究人員表示，已

新小鼠模型助推藥物和新冠疫苗研發

發佈於: 科技2020-06-14標籤: 新冠疫苗研小鼠研究人員人ACE2蛋白

　　新冠肺炎疫情暴發以來，全球科學家競相研發相關藥物和疫苗，但諸多努力囿於易感染新冠病毒實驗小鼠數量有限而無法很好地開展，這種情況即將改變!美國科學家在6月10日出版的《細胞》雜誌在線版上刊文指出，他

澳研究人員稱美散佈涉華虛假信息外交部：讓政治病毒及幕後黑手在陽光下無處遁形

發佈於: 科技2020-06-13標籤: 遁形陽光下研究人員幕後黑手

　　中國日報6月9日電（記者周瑾）外交部發言人華春瑩9日在例行記者會上表示，今天是中國同菲律賓建交45週年紀念日，中方願同菲方一道，落實好兩國領導人重要共識，進一步增進政治互信，深化全面合作，為兩

少吃外賣！研究：下館子吃外賣更多攝入有害PFAS，在家做飯最健康

發佈於: 健康2020-06-13標籤: 外賣少吃研究人員化學物質

現代人的生活節奏越來越快，特別是年輕人越來越鍾情於美味的餐館以及外賣，甚至很多星級酒店都加入了外賣的行列，然而下館子多吃外賣和自己在家裏燒火做飯，對我們身體的健康影響究竟有多大的不同呢？一項新的研究表

不運動也能瘦？Nature子刊：科學家開發出“燃脂”分子，不節食就能減肥

發佈於: 健康2020-06-13標籤: 開發出燃脂研究人員線粒體

如果要問世界上最難走的路是什麼，小編認為，那一定是減肥的路。俗話説，一口吃不成一個胖子，但是一口接一口卻可以。幸福的肥胖總是來得格外容易，然而悲劇的是，每塊肉都有它的脾氣。節食不健康，運動又太累

女子卻有男兒身！性別發育“偏軌” 只因一個基因突變

發佈於: 健康2020-06-13標籤: 基因突變性別研究人員發育

性別：□ 男 □ 女這個填表的常規問題，大部分人都不會遲疑。但對“性別發育異常”的人來説，性別，卻是模糊的存在。在《美國國家科學院院刊》近期發佈的研究論文中，研究人員分析了 78 例病因不明的

自動駕駛比人類開車更安全嗎

發佈於: 科技2020-06-13標籤: 自動駕駛開車研究人員馬斯克

在美國，94%的車禍都是由人為原因引起的，而自動駕駛汽車只能阻止這其中三分之一的事故發生撰文 / 朱琳編輯 / 黃大路設計 / 趙昊然來源 / freep、lemberglaw、consumerre

只需70分鐘!科學家發明基於RBD新冠抗體測試特別針對輕度或無症狀患者

發佈於: 科技2020-06-13標籤: 抗體測試新冠研究人員特別

由於COVID-19大流行仍在繼續，美國每天報告的新增感染人數上萬人，為更好地瞭解感染率，特別是可能存在輕度或無症狀的攜帶者，因此，進行廣泛適用的監測檢測仍十分必要。北卡羅來納大學醫學院的科學家和同事

製造“超表面”的新技術：未來相機鏡頭將變薄數千倍！

發佈於: 科技2020-06-13標籤: 新技術相機鏡頭研究人員雷達

據瑞典查爾姆斯理工大學官網近日報道，該校研究人員展示了一項用於製造“超表面”的新技術。未來，相機鏡頭將變薄數千倍，而且製造所需的資源密集度明顯降低。背景過去十年，光學領域發生了一場革命。我們

永遠不要做一個“老實人”，否則你會長期受到別人的壓制和剝削

發佈於: 綜合2020-06-13標籤: 到別人做一個研究人員長期

“老實”這個詞語，在日常生活中，總是被用來形容那些忠厚、遵守規則、安分守己以及具有服從性的人。常常有人戲謔稱：“女生玩夠了，就會找一個老實人嫁了”“老實人接盤”等等。因為，和老實人在一起，既能被照顧妥