圖靈獎得主、AAAI候任主席展望“AI未來10年”
作者 | 青 暮
編輯 | 叢 末
經典人工智慧方法在未來會得到關注嗎?經典方法和深度學習的關係將如何發展?新的突破點又在哪裡?
就上述話題,北京智源研究院邀請張宏江、圖靈獎獲得者John Hopcroft、AAAI候任主席Bart Selman共論AI,探討“AI的過去和未來10年”。在具體討論過程中,採用了張宏江發問,John Hopcroft、Bart Selman回答的形式進行。在論壇最後,兩位教授還向中國的學者提出了中肯的建議。
艱難的50年和騰飛的10年:經典AI和深度學習的不同境遇張宏江:今天我們非常幸運請到了圖靈獎的獲得者John Hopcroft教授,美國康奈爾大學的計算機科學教授Bart Selman。今天我希望跟兩位教授一起回顧人工智慧過去幾十年的發展,並且介紹他們對於人工智慧未來十年發展的方向和途徑的看法。今天的主題叫“人工智慧新的10年”,在談新的十年之前,請兩位先談一下對過去60年,尤其是過去10年的回顧。
Bart Selman:這個領域的最初工作主要是由對理解人腦的思維和認知感興趣的研究人員完成的,在人工智慧的早期有很多樂觀主義者,但在實際研究過程中遇到了很多意想不到的困難。這個領域在近幾十年來純粹是一門學術學科,因為我們無法在任何可以與人類相比的地方獲得很好的成果,第一個轉折點是IBM在1997年開發出國際象棋AI深藍的時候。深藍在國際象棋中打敗人類,這是當時的一個突破。
大約在2012年,多層神經網路即深度學習幾乎都改變了整個領域,使得我們可以實現視覺識別和語音識別等任務。人們發現,深度學習演算法幾乎超越了所有型別的機器學習模型,算力的發展是這段時期改變人工智慧領域的原因。2012年,我們讓AI實現了感知。我不會說感知問題已經解決,但我們離解決更近了一步。此外,這些技術還能和經典人工智慧的技術結合,例如決策、規劃、推理等。
張宏江:John Hopcroft教授,您能基於Bart Selman教授的觀點分享一下您的看法嗎?
John Hopcroft:上世紀60年代初,人工智慧剛起步。當時約翰·麥卡錫創造了斯坦福大學的人工智慧實驗室,有大量高素質的研究人員在研究符號邏輯。1964年,人工智慧的研究者只能訓練單一的權重,原因是根本沒有算力,缺乏大型資料集,連手寫字元資料集都沒有。事實上我拿到博士學位時,才做出了一個包含1000個10x10畫素手寫字元的資料集,這和今天的資料集相比是很小的,但是在那時已經是很大的了。
2012年AlexNet出現了,直到那時影象識別錯誤率才開始顯著下降。AlexNet將影象識別錯誤率從25%降到了15%,這是一個巨大的進步。AlexNet有大約8個層級,在2015年影象識別大賽的冠軍ResNet則有1000個層級,並且它只有3.6%的錯誤率,而人類識別這些影象時有5%的錯誤率。這些技術已經被應用到了非常多的領域,如醫學、金融等。
張宏江:在上世紀90年代,我們發現經典人工智慧方法不管用,現在我們知道是因為沒有足夠的算力,在過去這幾年,由於算力的發展,我們獲得了極大進展。那麼現在,我們在推理等經典人工智慧方法的探索上處於什麼階段呢?
Bart Selman:我覺得現在人們經常把AI等同於深度學習,或者把深度學習等同於AI。過去十年來我們在推理等演算法的研究上實際上已經有很大的進步,並且已經有了實踐應用,例如英特爾、微軟等企業,只是並不廣為人知。在社群中,這些技術也被廣泛應用。
AlphaGo是深度學習成功的範例,但實際上AlphaGo使用了樹搜尋演算法,這也是一種符號推理演算法。這也是AI領域出現的巨大進步,我們可以組合不同的演算法,例如推理、規劃和深度學習方法等。
自動駕駛汽車領域在組合不同的人工智慧方法的探索上更加開放。當然你也可以嘗試用端到端的方法來訓練自動駕駛系統,但這太困難了。深度學習一般作為自駕系統的視覺系統,但是控制系統和路徑規劃系統等則需要更多的經典人工智慧方法。
相比較而言,深度學習確實是非常資料驅動的方法,這跟經典人工智慧中我們稱之為知識的方法不同。知識就像牛頓定律或萬有引力定律,人類的認知需要很多真實的知識。而深度學習要獲取知識並不容易,深度學習目前如此有效,是因為我們有大量的資料。我認為深度學習下一步需要學會獲取知識,這是個巨大的挑戰。
張宏江:人工智慧是一個非常寬泛的領域,深度學習僅僅是一部分。Hopcroft教授,您在過去的50年裡,在計算理論上做了很多工作,您願意和我們分享一下,從理論和演算法的角度如何看待人工智慧的進展嗎?
John Hopcroft:我首先再談論一下深度學習,深度學習真正的意義是在高維空間中更好地識別。比如你在看腳踏車的影象,深度學習不會告訴你腳踏車的函式是什麼。如果你展示的東西看起來像腳踏車,但不能讓你騎著它去地鐵站,它仍然會把它歸類為腳踏車。為了解決這個問題,我們需要將邏輯加入深度學習。
深度學習可以將腳踏車進行分解,它會告訴你腳踏車有輪子、鏈子、座椅、踏板等等。對這些部件,你可以新增邏輯,說踏板帶動了鏈子然後帶動輪子,從而腳踏車可以移動,車頭可以讓你把控方向和轉彎,座椅可以讓腳踏車有運輸功能。透過新增邏輯,或許就可以構建關於腳踏車的函式,這個函式的意義是將一個人從一個地點運輸到另一個地點。
關於人工智慧理論,單閾值邏輯單元可以用一個非常簡單的演算法來訓練。如果影象集合是線性可分的,那麼閾值邏輯可以實現分類。如果影象集合不是線性可分的,應該將集合對映到更高維的空間中,使得集合是線性可分的。關於訓練閾值邏輯單元的方式,你也可以不將資料對映到高維空間中,而在原始空間中執行演算法,這就是構建支援向量機的技術。直到深度學習發展之前,這是人工智慧領域的主要技術。
還有關於過擬合的問題,假設你有一個大型資料集,該資料集告訴我中國所有人的年齡和薪資。我想要問在某個確定的年齡和薪資上有多少人,但是不想儲存整個資料集,因為我想把資料集放到手機上。因此我取資料集的一小部分,並且在適當地擴充套件之後,相信答案會非常接近真值。答案的真假取決於我們要問的問題的範圍,並且需要多大規模的樣本的數學取決於問題的複雜性。
如果大家對這些數學感興趣的話,可以看看我所寫的書。在這本書的第五章,包含了所需要的數學知識。在我的照片下面寫著劍橋(Cambridge)的地方,可以得到PDF的連結。
John Hopcroft主頁:https://www.cs.cornell.edu/jeh/ 2
張宏江:Selman教授,我們知道您之前發表過美國人工智慧研究未來20年的白皮書,可以分享您對AI未來發展趨勢以及重點的看法?
白皮書地址:https://arxiv.org/abs/1908.02624
Bart Selman:我認為人工智慧研究的未來趨勢是社群化,在業界有很多大型的研究團隊在快速組建。美國正在構建國家AI基礎設施,為不同的學術研究團隊提供試驗檯。大多數研究專案無論是人力還是財力對於個人都是無法承受的,需要大量資金用於基礎設施軟體和機器開發,所以必須共享資源,允許協作。除了仍然要強調知識和深度學習的結合以外,我認為自我意識學習是未來人工智慧發展的重點。
張宏江:您所說的自我意識學習到底是什麼意思?為什麼您認為這是未來20年人工智慧發展的首要任務?
Bart Selman:這是一個我們還沒有解決的問題。人類能以不同的方式學習,例如我們去學校學習新技能,這相比於資料驅動學習而言是非常不同的型別的學習。人類不需要學習上百個例子就可以掌握新技能。自我意識學習就是指,AI會反省自己的學習方式,然後調整它的學習行為。
例如,AI會反思:我不太明白學習的微積分的知識,我想問一些問題,我想做一些微積分的練習來提高。這個過程中使用的學習例子很少,不需要數以百萬計的例子。這些學習風格是人類獨有的,而當前的人工智慧並沒有掌握。
張宏江:當我們回顧過去50多年的歷史,人工智慧有一個非常緩慢的發展過程,然後10年前深度學習的出現使領域飛速發展。現在要發展自我意識學習,您認為我們還要再花費50年時間嗎?您認為自我意識學習中,算力仍然是最重要的因素嗎?
Bart Selman:我認為可能要再花費10年到20年的時間,這很難預測,畢竟一些研究需要基礎層面的突破。現在和過去50年非常不同的是,我們已經有了資料,所以我對未來還是非常樂觀的。
我覺得算力還是必要的組成。我認為自我意識學習,也就是說將深度學習和知識、推理結合起來,還需要很多新的idea。在機器翻譯領域,深度學習做的非常好,可以達到90%以上的準確率。問題是最後的10%的提升,可能需要相當不同的方法。在自動駕駛系統中,機器做出的決策必須是非常準確的,容不得一絲馬虎,這樣才能確保乘客的安全。所以對於最後的10%的提升,我們還需要做額外的工作。
張宏江:資料和知識之間是有差別的,這我很贊同。Hopcroft教授,您可以就人工智慧的未來談談你的看法嗎?
John Hopcroft:農業發展需要很長時間,而製造業發展只需要幾百年,人工智慧只用了50年的時間就發展到了今天的地步。所以我認為接下來的發展會非常快,就像你建立工具來支援更有效的工作。
在未來,我們需要解決可解釋性問題、偏見問題、常識問題、責任問題、持續學習問題,此外還包括AI取代人類工作後出現的各種社會問題。
張宏江:Selman教授,您對於我們何時能實現通用人工智慧有什麼見解呢?
Bart Selman:未來10年,我們將更加註重專業能力。但到未來20年,我們會集中發展常識、知識、真正的語言理解等領域。真正的語言理解,即機器會像人一樣閱讀。一旦這個問題解決了,人類就能實現下一次人工智慧發展的飛躍。機器一旦掌握如何理解語言,對我而言,就相當於實現了通用人工智慧。
張宏江:Hopcroft教授,您有什麼要補充的嗎?
John Hopcroft:在接下來的10年裡,人們可能會聚焦於如何利用工程技術的最新成果解決特定問題。但我們也需要基礎研究,甚至是人工智慧領域外的基礎研究。在過去的25年裡,基於人類大腦發育的研究也是很重要的。現在人們知道在兒童生命的頭兩年,大腦會學習如何學習。在未來,真正的進步可能來源於生物學,但真實情況仍然是不確定的。
張宏江:Selman教授,您能否談談,美國近期在人工智慧的政策上做出了哪些正確的決定?
Bart Selman:我認為美國做對的決定是,對人工智慧領域的研究堅持投資60年,即使什麼成果也沒有,這是一件非常困難的事情,我們不一定知道下一步的發展方向。
如果我們繼續投資於各種各樣的研究專案,會得到下一個突破。而如果只是投資到某些喜歡的領域,特別是目前最喜歡的領域,可能不會實現突破。研究突破是革命性的,不是進化性的。我相信這就是人工智慧的未來,更大的規模,以及更加協作的人工智慧研究專案。
張宏江:您能否也說說中國在人工智慧支援政策上有哪些做對的地方?
Bart Selman:我認為中國在人工智慧支援方面做得很好,如果要提建議的話就是,不要侷限於一個領域。看看人工智慧的歷史,有很多非常困難的問題是從人工智慧的歷史中就提出的,實際上還沒有解決。所以我鼓勵新一代研究者熟悉歷史,走向比資料驅動更廣泛的領域,例如類腦學習、one-shot learning等等。除了深度學習,還有一些非常重要的領域,即使你專注於深度學習,也不要太狹隘。 3
張宏江:您建議允許人們探索不同的領域,即使可能會失敗,也可以從這些失敗中學習。最後一個問題,你們會給中國的人工智慧研究人員提什麼建議呢?
John Hopcroft:我的建議就是遠離指標,中國的研究人員非常感興趣於發表的論文數量和得到的研究資金數量。遠離這些指標,並關注其它的一些更有價值的層面。
張宏江:非常好的建議,所以不要只追求數字。那Selman教授,您有什麼建議呢?
Bart Selman:我會建議中國的研究人員多關注有創造意義的研究,並願意考慮其他人沒有考慮到的問題,我也同意Hopcroft所提的建議。看看那些沒有解決的問題,看看那些最難解決的問題,下一個突破比下一個增量式論文更有價值。
張宏江:非常感謝John Hopcroft教授和Bart Selman教授,我們回顧了過去幾十年在人工智慧上取得的突破,以及我們對下一個10年的展望。在未來,我們或許會看到,人工智慧社群走向全球化,經典人工智慧未來可期,並與深度學習協同發展,人工智慧的各個領域會迎來百花齊放的盛況,新的突破點潛藏其中,或者在領域之外會帶來驚喜。雷鋒網雷鋒網雷鋒網