楠木軒

阿里22篇論文入選國際頂會ACL 2020,自然語言處理技術實力全球領先

由 公松臣 發佈於 科技

自然語言處理(NLP)領域頂級會議ACL 2020近日公佈論文評審結果,阿里巴巴22篇論文入選,並有多篇論文成為高分優質論文,無論數量還是質量均遙遙領先,顯示阿里在前沿AI研究領域的強大實力。

ACL是全球自然語言處理領域最具影響力的學術機構,其組織的年度會議被公認為NLP領域創新的風向標,包括Google、微軟等在內的科技企業每年都會在ACL大會上公佈多項研究成果,入選論文已經成為業界衡量企業自然語言處理技術實力的重要指標。

阿里22篇論文來自達摩院語言技術實驗室,螞蟻金服技術部門,阿里雲小蜜算法等團隊,其中僅達摩院語言技術實驗室就有18篇入選。論文覆蓋跨領域分詞、細顆粒度情感分析、多領域對話系統、文本生成、知識蒸餾等諸多NLP領域的熱點和前沿研究方向,提出了包括基於對抗學習的降噪技術、多領域對話行為與文本同步生成、關係型圖注意力網絡、利用結構化信息進行知識蒸餾的方法等創新技術和理念,在觀點識別、多語言NLP和機器翻譯等場景中具有很大的應用價值。

阿里不僅入選論文數量國內遙遙領先,論文質量也得到評委一致認可。在入選論文之中,有論文提出了創新的框架,結合新詞發現和共有詞學習技術,利用機器去自動化地標註新領域的詞,從而實現跨領域的分詞學習;另有論文提出多種創新性的方法,大幅提升單個算法模型對30多種語言進行智能序列標註的效果。這些優秀論文得到評委一致高分認同。

在自然語言處理領域,阿里積澱深厚。早在2018年初,阿里AI在機器閲讀理解頂級賽事SQuAD中打破世界紀錄,首次超越人類成績。今年3月,在全球自然語言處理領域頂級評測GLUE Benchmark中,阿里巴巴達摩院以平均分90.3分的成績再次創下自然語言理解技術新的世界紀錄。

以達摩院語言技術實驗室為代表的阿里自然語言處理技術已在電商、雲計算、金融科技、協同辦公、智能客服等商業生活場景得到廣泛使用。達摩院語言技術實驗室負責人司羅表示,近年來自然語言智能處理技術在多模態融合、融合大規模預訓練模型的語言理解等方向取得了突飛猛進的發展,未來阿里會繼續加強在這個領域的研發。