楠木軒

阿里新一代安全架構核心AI技術奪冠,機器閲讀理解準確率戰勝人工

由 司馬盼香 發佈於 科技

【獵雲網北京】9月10日報道

機器閲讀理解是自然語言處理領域最受關注、進步最快的技術方向之一。日前,阿里安全在由中央網信辦、工信部、公安部指導,廈門市政府主辦,多方攜手打造的中國人工智能大賽上,戰勝120多家參賽隊伍,獲得該技術領域團體賽冠軍。

阿里安全新一代安全架構核心AI技術,也成為唯一一支在閲讀理解中,答題準確率高於80%的參賽隊伍,高於人工75%的準確率。

阿里安全團隊獲得全國人工智能大賽冠軍

阿里安全高級算法專家開陽介紹,機器閲讀理解技術給用户和企業帶來很大價值:“這項技術能夠幫助用户從長篇文本內容中,快速理解核心觀點,返回問題答案,可以直接用在一些問答場景中。”開陽表示,作為一項通用能力,這項技術也可以提升機器對自然語言的語義理解能力,幫助完成其他自然語言理解的任務。

比賽前,阿里安全團隊針對競賽任務做了細緻的分析,針對本次競賽任務特點設計了從“數據預處理—單模型優化—特徵選擇—多模型融合—主動學習”的處理流程,成員間分工明確,默契配合,在有限的參賽時間內,最大化輸出效率,為最終奪冠奠定了基礎。

在技術方面,阿里依託於最新的預訓練語言模型,通過對不同預訓練模型(包括RoBerta、Albert、Electra等)融合,提取不同語義特徵的優勢,實現優勢互補,最終提升對複雜語境的理解能力。

開陽介紹,自然語言本身存在非常大歧義,特別是在安全場景下存在激烈的對抗,黑灰產會利用一些歧義的語義來繞過檢測傳播有害內容。只有不斷提升自然語言的理解能力,增加對複雜語義的理解,才能更有效對抗黑灰產,守衞用户安全。

因為社會進程需要,再疊加疫情因素,如今政府和各行各業都在進行數字化轉型,新基建建設如火如荼,為了增加新基建的安全性,阿里安全綜合20年的經驗和技術能力,提出新一代安全架構,並在不斷升級該架構核心技術層的AI技術能力,解決新基建場景下的安全問題。

“阿里的安全架構理念將人工智能作為基建的一部分,提供基礎能力支撐。我們將繼續開發人工智能技術,保障數字經濟的健康有序發展。”開陽表示。