讓AI學習語法原來很簡單 只要一直讓它們玩填字遊戲
在訓練人工智能模型時,怎麼樣讓它在掌握紮實的詞彙和詞類基本知識後,進一步瞭解語法?
以下面這句話為例:“廚師跑去飯店吃飯”。這句話有許多元素,該怎麼理解?是廚師去吃飯,還是飯店吃飯,抑或是廚師開的商店在吃飯?
普通人基本上能順接理解這句話的意思,但即使是最先進的人工智能系統,也會對此感到困惑。畢竟,從這句話中截取一部分,就是“飯店吃飯”。
過去讓先進的機器學習模型解決這些問題,主要是通過大量人工數據訓練,工程師“手把手”地教授語法、句法和其他語言原理。
問題是,這種方法昂貴且需要大量人力,且仍然難以教會計算機處理一些含糊不清的問題。在實際語言中,根據句子結構和語境的不同,同一組詞的意義可能有很大的不同,中文尤其如此。
但斯坦福大學人工智能研究人員的2項新研究發現,先進的人工智能系統也可以自行摸索出語言原理,不必預先練習人類標註的數據。這種方法更接近於人類兒童學習語言的方式。更令人驚訝的是,研究人員還發現,人工智能模型似乎還能推斷出適用於不同語言的“通用”語法關係。
這對自然語言處理有很大的影響,而這種語言處理在回答問題、翻譯語言、幫助客户甚至審查簡歷的人工智能系統中越來越重要。
這種方式成功的關鍵是讓機器參與數十億個“瘋狂填詞”(Mad Libs)遊戲。歐美曾流行的一種羣體遊戲,共同編造一個故事,故事內容可以隨想象力無限發散。人工智能模型可以以此學到很多關於語言的知識。在這個過程中,為了更好地預測缺失的單詞,他們會自動創建單詞的相互關係模型。
這些模型變得更大、更靈活的過程,實際上就是在自我組織,最終逐漸發展成人類語言的結構。這和人類兒童的思維很相似。
譯/前瞻經濟學人APP資訊組
參考資料:
[1]https://techxplore.com/news/2020-07-ai-mad-libs-grammar.html