阿里新一代安全架構核心AI技術奪冠，機器閲讀理解準確率戰勝人工

2020-09-17由司馬盼香發佈於科技

【獵雲網北京】9月10日報道

機器閲讀理解是自然語言處理領域最受關注、進步最快的技術方向之一。日前，阿里安全在由中央網信辦、工信部、公安部指導，廈門市政府主辦，多方攜手打造的中國人工智能大賽上，戰勝120多家參賽隊伍，獲得該技術領域團體賽冠軍。

阿里安全新一代安全架構核心AI技術，也成為唯一一支在閲讀理解中，答題準確率高於80%的參賽隊伍，高於人工75%的準確率。

阿里安全高級算法專家開陽介紹，機器閲讀理解技術給用户和企業帶來很大價值：“這項技術能夠幫助用户從長篇文本內容中，快速理解核心觀點，返回問題答案，可以直接用在一些問答場景中。”開陽表示，作為一項通用能力，這項技術也可以提升機器對自然語言的語義理解能力，幫助完成其他自然語言理解的任務。

比賽前，阿里安全團隊針對競賽任務做了細緻的分析，針對本次競賽任務特點設計了從“數據預處理—單模型優化—特徵選擇—多模型融合—主動學習”的處理流程，成員間分工明確，默契配合，在有限的參賽時間內，最大化輸出效率，為最終奪冠奠定了基礎。

在技術方面，阿里依託於最新的預訓練語言模型，通過對不同預訓練模型（包括RoBerta、Albert、Electra等）融合，提取不同語義特徵的優勢，實現優勢互補，最終提升對複雜語境的理解能力。

開陽介紹，自然語言本身存在非常大歧義，特別是在安全場景下存在激烈的對抗，黑灰產會利用一些歧義的語義來繞過檢測傳播有害內容。只有不斷提升自然語言的理解能力，增加對複雜語義的理解，才能更有效對抗黑灰產，守衞用户安全。

因為社會進程需要，再疊加疫情因素，如今政府和各行各業都在進行數字化轉型，新基建建設如火如荼，為了增加新基建的安全性，阿里安全綜合20年的經驗和技術能力，提出新一代安全架構，並在不斷升級該架構核心技術層的AI技術能力，解決新基建場景下的安全問題。

“阿里的安全架構理念將人工智能作為基建的一部分，提供基礎能力支撐。我們將繼續開發人工智能技術，保障數字經濟的健康有序發展。”開陽表示。