ACL 開幕首日：評審制度改革，主題報告探討 NLP 未來方向

從今天開始，ACL 2020正式進入主會議日程！首日全體大會分為三個部分：開幕式、主席演講、以及主題報告。

其中 Dan Jurafsky, Joyce Chai, Natalie Schluter, Joel Tetreault開幕式報告，介紹了這屆ACL 論文情況；Hinrich Schütze 在主席演講中，介紹了ACL 評審制度的改革：增加ACL Archives，接收因為25% Cut制度而被拒的論文；主題演講則由Kathleen R. McKeown 帶來，報告題目為《Rewriting the Past: Assessing the Field through the Lens of Language Generation》。

ACL論文情況：投稿創歷史新高

ACL2020今年的論文提交數量創了新紀錄，ACL2019 共接收了2906篇論文，今年則收到了來自57個國家的3429篇論文，比2019年增長了18％。下圖展示了自2010年以來ACL的論文提交數量。

在短短10年中論文，ACL的論文提交數量增長了近3倍。

下圖展示了提交數量超過200篇論文的5個領域。機器學習領域幾乎每年都提交了近300篇論文，其它4個領域包括：對話和交互技術、機器翻譯、信息提取和NLP應用。

今年提交的論文涉及25個主題，其中包含4個新主題：第一，道德和NLP主題，包含評估了NLP應用程序在社會中普及時相關的倫理學假設和後果的論文；第二，對NLP模型的解釋和分析主題；第三，理論和形式主義主題；最後一個主題是盤點我們探索過的領域和我們將要探索的領域。

今年總共接收了778篇論文，創歷史新高，其中長論文570篇，短論文208篇。論文總接收率是22.7%，與最近的三次ACL會議相近，長論文接收率為25.4%，短論文接收率為17.6％。下圖展示了自2017年來ACL的論文接收率情況。

今年評審委員會的規模創歷史新高，有9497個審稿人註冊。最終2519名被選為主審稿人以及458名被選為次審稿人，299名被選為領域主席，40名被選為高級領域主席。

在主審稿人中，至少有四次評審經驗的審稿人數量僅佔35％（下圖中藍色和黃色部分）。因此，絕大多數審稿人經驗相對較少。對於這一做法，ACL給出的解釋是，因為評審質量不僅僅取決於那些有經驗的人，也要為未進入過該領域的人積累更多的經驗。這是一次新的嘗試，探索如何通過指導和培訓新的審稿人來提高審閲質量。

據悉，共有280名領域主席和290名新人審稿人蔘加了該計劃。在審核期間，特別是在討論過程中，領域主席直接與通訊作者聯繫，最後大會組委會會向領域主席和論文作者們尋求評審反饋。

下圖是主要會議時間表，每個會議時長1小時。每篇論文都分配了其中兩個會議。因此，你可以觀看他們的預先錄製的演講，然後觀看會議以直接與作者互動。這些會議還包括演示文件和研討會。此外每天還有一個2個小時的全體會議（Plenary Session），大會的獎項都在全體大會中公佈。

全體大會中會舉辦多個獎項的頒獎典禮，包括終身成就獎、傑出論文獎、時間考核獎和最佳論文獎。

全體會議的一大亮點是主題演講。今年ACL請來了來自哥倫比亞大學的Kathleen R.McKeown教授，以及來自MIT的Josh Tenenbaum教授在會議上發言。

主席演講：評審制度改革

Hinrich Schütze 還做了主席演講，隆重感謝了ACL的大會主席以及程序主席，簡要回顧了ACL的關鍵人物，同時也對ACL的審稿制度的改革進行了説明。

Hinrich Schütze表示，這是ACL第一次組織完全的在線會議，非常感謝Joyce Chai、Dan Jurafsky、Natalie Schluter、Joel Tetreault這四位主席，他們對ACL 2020 虛擬會議的召開起到了不可磨滅的作用。

同時ACL 還有一些關鍵的人物，做了非常多的後勤任務，如下張PPT所示，正是他們的存在，才組成了專業的組織。

在視頻中，Hinrich Schütze還點出了負責可持續發展關鍵人物的Tim Baldwin，他指出，雖然可持續發展是一個新的角色，但是它的作用非常重要。

同時，Schütze還提到，由於一些原因，今年一整年對於ACL來説可能會一直面臨財務危機，感謝David Yarowsky和Priscilla Rasmussen 在財務方面的支持。

今年的ACL在IT 基礎設施方面有些非常重大的進步，這要感謝信息主任Nitin Madnani。

在感謝完“TACL”之後，Schütze介紹了ACL的審稿制度改革，整個方案分為短期和長期，短期方案在6月份通過，長期方案只是一項建議。

在短期方案中一個比較特殊的點是：會建立 ACL Archives，建立的動機是有很多好的論文因為沒有它們沒有達到25%的削減標準（因為它們沒有達到25%的削減標準）。這裏給出的建議是除了接收25%，還要發表額外的10%在ACL Archives。

當然，這是同行審議的另一種選擇，這會導致35%的論文被接收，當然也沒有人強制你在ACL Archives 上發表論文，一切都是自願的，一切都在實驗中。另外，值得一提的是，ACL Archives是獨立於主會議之外的。

在最後，Schütze也介紹了接下來一些會議的舉辦時間與地點，包括EACL、NAACL、EMNLP等，Schütze還説，雖然這些會議有可能是線上舉行，但還是希望有幾場“實在”的線下會議。

主題報告：Rewriting the Past

在報告《Rewriting the Past: Assessing the Field through the Lens of Language Generation》中，Kathleen R. McKeown提到：近年來，自然語言處理領域通過使用神經網絡取得了巨大的進步，幾乎完全讓這個領域變了模樣。

當前需要審視了自然語言處理領域的現狀及其與過去的聯繫，並且關注多種形式的語言生成。具體包括：神經網絡在哪些方面特別成功？過去的方法在哪些方面可能仍有價值？以及如果要超越“當下”，需要轉向什麼方向？為了回答這些問題，McKeown對眾多自然語言處理領域的專家進行了訪談。

McKeown表示，當他在1982年還是一位PHD學生的時時候，讀過Warren Weaver寫的一本關於機器翻譯的思想的書，當時看起來不起眼，但是卻是現在統計學和神經機器翻譯研究背後的靈感來源。

書中提到，語言生成在一定程度上是rewriting，這有很多形式，可以是從結構化數據彙總進行生成，也可以是輸入文本到輸出摘要的rewriting等等。

而機器翻譯也正是從一種從語言的輸入rewriting到另外一種語言的輸出。那麼這語言生成形式未來會走向哪裏呢？

McKeown 表示：他沒辦法很好的回答，所以他與機器翻譯以及語言生成等方面專家進行了交談，試圖想找到該領域未來的走向。整個訪談分為過去、現在和未來三個維度。

McKeown的第一個問題是：神經網絡當前最大的成就是什麼，它們真正成功的地方在哪裏？

McKeown先列舉出了當前的神經網絡的進展文章，例如抽取模型（Extractive models）中的LSTM Seq2Seq、RNN plus history、BERT for summarization等；摘要模型中的Attention based copy and coverage、BART:LSTM pre-trained language model等。上述這些工作非常複雜，也非常成功，那麼神經網絡的成功之處到底在哪？

MIT的Regina Barzilay表示，神經網絡最大的成功就是催生了許多實用模型，這些模型的正在被數百萬人使用，而我們之前的一些工作更多的是一種“研究模型”。

亞馬遜AI的Ramesh Nallapati表示，當前在自然語言處理領域，即使背景知識很少的人也能部署模型，畢竟只要把他們當做“黑盒子”就行了。

康奈爾理工學院的Sasha Rush表示，他之前一直以為“翻譯”是經驗驅動型的領域，但是自從有人向他展示了基於注意力的翻譯模型後，他完全轉變了之前的看法。

MIT的Jacob Andreas表示，廣義上的語言生成應用，無論是無條件的還是有條件的，神經網絡比我們以前的結構化輸入少得多。

微軟研究員Michel Galley表示，“總結”和翻譯是一種語義保存，當然了，深度學習雖然有改進，但在做語義保存的過程中也會有信息損失。另外，對話領域在深度學習出現之前，一直是靠經驗直覺。

亞馬遜的Dilek Hakkani-Tur表示，從他第一次看到機器翻譯中使用注意力機制開始，學習並“注意”對話歷史的某些部分對追蹤對話狀態、生成與對話歷史一致的響應等有很大的幫助。

Yejin Choi表示，NLP中的預訓練模型取得了巨大的成功，對他個人來説，這些模型在生成連貫性文本方面的能力也非常強，這讓他非常興奮。

除了上述觀點，其他觀點有：神經網絡是擬合高度非線性函數的唯一途徑；對NLP的最大的影響來自單詞語義的表徵，因此，我們不能僅將單詞視為小字符串，否則只能分析少量標籤數據；神經網絡方面最有潛力的是表徵學習。

在上述專家發表完觀點，McKeown總結道：深度學習已為機器翻譯、文本摘要等領域創造了具有魯棒性的方法，並且其成功背後的機制也多種多樣，包括注意力、預訓練語言模型、詞嵌入、表徵學習等，並根據大數據擬合高度非線性的函數。

第二個問題：回溯過去，語言學、哲學、以及心理學為NLP領域提供了怎樣的認知方法？

McKeown表示，過去有很多這方面的文章，在提供程序約束（pragmatic constraints），中心理論將“注意力集中”相關聯，以及在指稱表達和語篇連貫方面提供了助力；哲學理論在表達藝術以及暗喻方面也提供了“推理”功能。

在20世紀90年代的時候，NLP的熱門方法是大數據分析，傾向於用語料庫分析詞選擇和詞約束。這時候語言形式主義使用了功能性統一語法（functional unification grammar）。

1990~2000年這十年間是統計NLP的領域，這期間統計指標成了評價標準，隨後研究方向轉向了機器學習，生成模型和支持向量機成了主流方法。之後，NLP又有了結構性轉變，最主要的標誌是用經驗方法處理自然語言。

那麼在這期間，我們學到了什麼呢？第一，系統建立在跨學科理論的基礎上的；第二，處理自然語言的過程在那個需要將數據擴展到精心設計的語料庫中；第三，NLP經歷了全面的改革；第四，即使是新的統計方法也體現了跨學科理論。

第三個問題：未來的NLP會轉向哪個方面？

首先，要向其他學科和傳統人工智能學習；再者，我們遇到更難的問題時候，有一箇中間表徵非常重要；其次，詞嵌入是否是正確的語義層次的總結？顯然我們需要衡量最重要的東西；最後，也許符號或語義知識會很有用。

未來還有很多需要解決的問題，例如如何處理更小但更有趣的數據集？我們該怎樣設計新穎有意義的任務？

在演講的最後，McKeown總結道：現在對我們來説有個好消息是，穩健的語言生成模型現在已經是可得的；而未來的算法要從任務中學習而不是從數據集中學習。值得一提的是，跨學科的方法已經在領域內產生了巨大的影響。

ACL 2020原定於2020年7月5日至10日在美國華盛頓西雅圖舉行，因新冠肺炎疫情改為線上會議。為促進學術交流，方便國內師生提早了解自然語言處理（NLP）前沿研究，AI 科技評論將推出「ACL 實驗室系列論文解讀」內容，同時歡迎更多實驗室參與分享，敬請期待！