裝了4億篇檔案的AI和人辯論誰贏了？IBM最強AI辯手首次登上《自然》封面

2018年，IBM研究院在美國舊金山展示首個能與人類進行復雜辯論的AI系統Project Debater，右側是以色列國際辯論協會主席Dan Zafrir.（來源：IBM）

鈦媒體3月18日消息，IBM研究院傑出工程師、Project Debater首席調研專家、人工智能專家Noam Slonim和團隊發表了最新研究成果：一個名為Project Debater（意為“辯手項目”）的自主系統，已可以與人類專家選手進行體面且有意義的現場競賽辯論。該系統能通過掃描儲存了4億篇新聞報道和維基百科頁面的檔案庫，自行組織開場白和反駁論點。雖然該研究中人類辯手被判定最終獲勝，但作者認為，評分接近人類專業辯手水平，人工智能（AI）技術或具備參與複雜人類活動的能力。

據悉，本研究成果於今晨登上了頂級學術科學期刊《Nature》（自然）雜誌封面。

本週《自然》雜誌封面圖

本論文通訊作者、IBM研究院傑出工程師Noam Slonim博士在接受鈦媒體App採訪時表示，作為有史以來首個人工智能系統，Project Debater可以與人類進行有意義的現場辯論，這一研究成果具有重大意義。同時，這也是IBM研究院掌握語言這一更廣泛議程上的一個重要里程碑。

鈦媒體瞭解到，本份研究中的IBM Project Debater是首次登上《自然》主刊封面。

事實上，AI發展到今天，應用層主要是計算機視覺（CV）以及聽覺環境中。雖然可能存在像GPT-3這種文章變換語言新技術，但未有其大規模商用化應用案例。如今隨着技術的發展，數據集的不斷延伸，具有創造力的AI辯論場景成為了新的可能。

IBM的Project Debater項目由來已久。

1997年，IBM研發的超級計算機深藍（Deep Blue）國際象棋比賽中擊敗了世界冠軍加里·卡斯帕羅夫（Gary Kasparov），而象棋一直被認為是一種人類社會的高智力博弈。

Project Debater項目最早於2011年被提出，研究目標是讓AI與人類進行現場辯論時應對自如。2018年，IBM Project Debater首次公開亮相，並與以色列國家辯論冠軍Noa Ovadia和以色列國際辯論協會主席Dan Zafrir進行辯論。最終在“是否應該增加使用遠程醫療”的其中一個議題中，Project Debater贏得了辯論，但在另一個“我們是否應該資助太空探索”話題中敗給了人類。最終以各獲一次勝利的結果展示給世人。

如今的這篇最新論文，更多是描述Project Debater項目中的體系結構並評估了其性能，還有使用AI賦能於辯論環境的技術過程。

具體來説，研究人員利用大量人工標記的高質量數據，通過訓練深度神經網絡 (DNN)和弱監督DNN來提高自然語言處理（NLP）技術框架，從而取得和人一樣的辯論能力，並通過文本轉語音方式輸出到外界當中。

論文中稱，Project Debater辯論過程主要由以下四個模塊組成：論點挖掘、論據知識庫（Argument knowledge base）、論點反駁和論證構建。

論點挖掘：是基於約有4億篇報道文章的大型語料庫（來自 LexisNexis2011-2018 語料庫），將文章分成句子，並用其中的單詞、維基百科的概念、預定義索引語句等進行分類，然後使用神經模型根據這些句子代表相關論據的概率對它們進行排序；
論據知識庫：旨在捕捉不同辯論之間的共性，通過論點進行手動編輯，分成專題，接着利用匹配方式將相關文本轉換至語音中，在輸出時包含鼓舞人心的引語、豐富多彩的類比、辯論的適當框架等；
論點反駁：更多是利用新的文本轉語音(TTS)算法技術，為Project Debater提供清晰流利、有説服力的語言表達能力，包括添加雙關語等，基於之前的語料，針對話題論點進行反駁。
論證構建：主要集成一個基於規則的聚類分析系統，將此前反駁的論點、論據串起來，對於每個集羣確定一個主題，類似於維基百科、百度百科的概念，從而完成與對手的辯論、交流。

那麼，AI辯手真的有能力和人進行主題辯論嗎？

論文中提到，研究人員向人類組成的虛擬觀眾提供了辯論的文字稿，讓他們在一系列話題（如資助學前教育）上對該系統與人類（包括專業辯手）和現有AI技術的辯論表現進行盲打分。儘管Project Debater在組織開場白方面的得分很高，明顯優於其他系統，但最後並沒能贏得辯論。

最終，Project Debater在78類辯題中獲得接近人類專業辯手的平均評分。

Project Debater得分情況（來源：論文）

作者認為，贏得辯論比賽並非IBM Project Debater項目的研發重點，僅僅預示着一個新技術的開始。未來，這種AI辯手將有潛力在全球範圍內協助人類制定日常的複雜決策。

“我們的辯論絕不是輸贏，我們想證明AI系統和功能如何理解、生成自然語言，我相信我們做到了這一點，並且在此過程中學到了很多東西。”Noam Slonim對鈦媒體App強調，AI辯手的作用，主要還是能夠幫助人們推理，模擬人類困境，建立充分的論據，提供數據驅動的辯論內容的生成和表達能力，做出更好的決定。

在《自然》雜誌附評論文章中，來自英國鄧迪大學（University of Dundee）辯論技術中心的Chris Reed撰文認為，該研究開發了一個完全自主的計算機系統，能夠與人類現場辯論。這一發現暗示，未來AI技術可以幫助人類制定並理解複雜的論點。

針對於該技術系統的難點和侷限性等問題，Noam Slonim表示，Project Debater的數據語料依然較少，情感層面還無法與人類比擬。

他認為，有些問題人類本能理解支持某一主題，但對於AI來説，直接理解十分困難，大都依靠數據語料。如果Project Debater沒有學習任何主題，其只能創建有説服力的描述，並非直接產生論點、論據等。他希望未來該系統可以覆蓋更龐大的語料庫，從而更好解決十分困難的辯論議題。

IBM方面透露，目前Project Debater項目已經實現了部分商業化，潛在應用包括金融顧問、律師、公共事務決策、學生助手和企業決策者等。在上週舉行的格萊美頒獎典禮上，該AI辯手就流行文化話題展開了非打分式辯論。

Noam Slonim強調，Project Debater解決了一個重大的挑戰，代表了AI技術的進步，而且拓寬（超出）了當前AI技術的舒適區，未來將能夠參與更加複雜的人類活動。

（本文首發鈦媒體App，作者｜林志佳，編輯｜蓋虹達）