圖片來源@視覺中國
文丨學術頭條
6 月 3 日,國際機器學習頂會 ICML 2020 放出了論文接收結果。
據官方統計,ICML 2020 共提交 4990 篇論文,投稿數量再創新高,而最終接收論文 1088 篇,接收率 21.8%。與往年相比,接收率逐年走低。
近4年ICML論文接收情況
ICML 是機器學習領域最重要的會議之一,因此在該會議上發表論文的研究者也會備受關注。受到疫情影響,今年的 ICML 大會已經改為在 2020 年 7 月 13 日至 18 日線上舉行。
在ICML2020召開之前,我們根據論文作者,研究機構,國家和地區幾方面給出了對本屆ICML會議的基本統計數據,以便大家對此次會議有一個基本瞭解。
論文作者讓我們首先來看一論文作者的排名(按論文數量)。
在 ICML 上發表論文是很困難的,因此能夠一次性發表多篇論文的作者會讓人印象深刻。來自日本理化學研究所(RIKEN)和東京大學的 Masashi Sugiyama 有 11 篇論文被接收,成為大會中被接收論文數量最多的作者。
在他之後是 Michal Valko(DeepMind)、Michael Jordan(UC Berkeley)以及 Dale Schuurmans(Google / U. of Alberta),三人均有 8 篇文章被接收。他們也是大多數論文的最後作者(這對大多數作者來説都是如此,許多人都是資深的資深研究者)。雖然沒有被列在這張圖的頂部,但是普林斯頓大學的 Chi Jin 作為第一作者的論文最多(3 篇第一作者論文超過 6 篇被接受的論文),而 Alexey Drutsa 是來自 YANDEX 的最多的單篇論文(2 篇論文是單獨作者超過 3 篇被接受的論文)。
排名前50的論文作者
從每篇論文的作者數量的分佈來看,大多數論文有 3-4 個作者,但是也有一些例外情況,比如 15 個作者。
有 15 個作者的兩篇論文分別是:由來自谷歌、牛津大學、劍橋大學、哥倫比亞大學和伯克利大學 15 位研究者發表的論文《Stochastic Flows and Geometric Optimization on the Orthogonal Group》和來自天津大學、阿里巴巴、清華大學以及上海交大的 15 位研究者發表的論文《Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential Advertising》。
國家地區這一部分展示的是論文作者與其所在國家或地區之間的關聯,以便查看哪個國家或地區發表論文數量最多。這種關聯數據的統計可能會有偏差,主要是因為無法辨認的人名縮寫、不同人對同一機構的不同叫法、錯別字等問題。
不同國家的論文數統計
毫不意外,美國承包了絕大多數論文。美國研究者參與的論文有 728 篇,大約是論文總數的 3/4,與其他國家和地區相比具有巨大的優勢。
排在第二位的是英國(123 篇),第三位是中國大陸(122 篇),二者在接收論文數量上相差無幾,但同樣僅為美國的六分之一左右。
需要注意的是,國家或地區是根據組織機構的總部所在地而定,而非論文作者所在位置。因此,如果一位論文作者在 Google 蘇黎世工作,那麼該論文被計入美國,而不是瑞士。
儘管如此,統計數量和實際情況也相差不多。如果僅按照大學分類(全球只有一個從屬國家和地區的組織),那麼將得到下圖:
不同國家論文數(僅統計大學)
也就是説,即使不考慮企業機構的因素,美國研究者仍然參與了 ICML 發表論文的一半以上。如果加上所有在美國工作的工業界研究者,數量可能和之前的圖很接近。
值得一提的是,英國和中國大陸大約發表了相同數量的文章。
機構與組織共有 494 個機構,362 所(73.3%)來自工業機構和 132(26.7%)來自學術界。587 篇論文(53.9%)純粹隸屬於學術研究,而只有 90 篇論文(8.3%)純粹來自工業研究組織,411 篇論文(37.8%)隸屬於兩者。
前 50 的機構發表了幾乎全部的論文,谷歌公司排名總體第一也是工業界排名的第一,谷歌的附屬機構 Deepmind 與 Google brain 也位於工業界排名的前 4 名,微軟公司在工業界排名第三。排名最高的大學分別為 MIT,Stanford,UC Berkeley,總體排名也僅次於 Google。在學術機構排名中 CMU 緊追上述 3 所大學排名第四。
總體排名及工業學術排名
讓我們再分別來看下論文數量排名靠前的幾個國家和地區機構的情況:
美國有大量的組織,無論是在工業還是在學術界,都有大量的論文。相反,英國的表現是由 DeepMind 領導的,其次是大學。
中國擁有強大的機構,但華為、阿里巴巴和百度等公司正在迎頭趕上。在加拿大,幾乎所有的論文都是大學發表的。另外除了美國和中國大陸,大多數國家和地區發表論文的頂級機構都是大學。從全球範圍看,大學發表的論文數量是公司的 3 倍。在美國以外,只有來自英國(DeepMind)、法國(Criteo)、中國大陸(華為、百度、阿里巴巴)、俄羅斯(Yandex)以及韓國(Samsung)的某些機構發表了 5 篇以上的論文。因此我們可以下結論説 ICML 仍然是以學術界為主導的會議。
參與每篇論文的組織數統計如下:
每篇論文參與的組織數
大多數論文有 1 或 2 個組織,但有些論文的撰寫有 7 個組織的參與。
兩篇有 7 個組織參與的論文分別是:由谷歌、微軟、華沙大學、阿姆斯特丹大學、加州大學歐文分校、蘇黎世聯邦理工學院以及倫敦帝國理工學院的研究者協作完成的《How Good is the Bayes Posterior in Deep Neural Networks Really?》和由蒙特利爾大學、IIIT Hyderabad、麻省理工學院、Mila、特拉華大學以及 LinkedIn 等機構的研究者協作完成的《Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning》。