楠木軒

為自動駕駛、機器人、虛擬娛樂裝上大腦...智能體如何改變未來 | 榕匯

由 烏雅建義 發佈於 科技

  6月21日,在2020北京智源大會——啓元星際AI頂級職業選手挑戰賽上,啓元世界自主研發的智能體“星際指揮官”,以兩個2:0的成績,擊敗了《星際爭霸I/II》全國冠軍黃慧明(TooDming),以及黃金總決賽三連冠選手李培楠(Time)。

  這是中國星際AI首次在公開比賽中戰勝國內頂級職業選手。也讓人們充分看到智能體在長期策略規劃、非完全信息博弈、超大規模動作空間等複雜決策問題上展現出的強大決策智能能力。

  所謂智能體,是具備自我學習、自主決策能力的主體,表現為數字人或機器人。

  在“星際指揮官”達到人類頂級職業選手水平之後,行業更加期待智能體從虛到實遷移,在現實世界中落地應用,從“西部世界”走向各行各業。

  智能體已經有哪些實際的商業化應用?未來5-10年,智能體會如何改變我們的生活?智能體將以何種速度進化,並不斷激發我們探索未知地帶?

  在賽事之後的行業研討環節,北京智源人工智能研究院院長、北京大學黃鐵軍教授,啓元世界CEO袁泉,高榕資本創始合夥人嶽斌,滴滴出行高級副總裁章文嵩,以及快手高級副總裁嚴強,共同探討了智能體在現實產業和虛擬世界中應用的當下與未來。

  高榕資本榕匯作為特別支持夥伴,將這場充滿技術想象力的對話實錄分享出來。

  以下為研討實錄精編:

  決策智能的無盡疆域與現實應用

  智能科學是無盡疆域

  Q:在與人類頂尖職業選手的對戰中,啓元“星際指揮官”的表現超出了所有人的預期,且僅用頂尖科技公司1%的算力,展現出世界一流的算法原創和工程實踐能力。如何看待智能技術的發展前景?

  黃鐵軍:從事自然科學的人經常説一句話,腦科學是自然科學最後的疆域,人的大腦是最難破解的未知地帶。

  而在這之後,智能科學是無盡的疆域。人類智能是億萬年進化的產物,機器智能雖然只有上百年的進化過程,但是進化速度很快。我們沒有任何理由認為機器智能不會超過人,因為人類智能也是在自然環境裏反覆訓練出來的。

  今天啓元的“星際指揮官”,已經在《星際爭霸》遊戲這樣複雜的環境中訓練出很強的智能;而在未來越來越複雜的訓練環境中,機器智能水平一定會越來越高。複雜到什麼程度?宇宙就是一個複雜的物理環境,對宇宙的探索,是由緩慢進化的人類完成?還是由高速進化的機器完成?這是值得思考的一個重大問題。

  總得來説,我們今天已經走在正確的道路上,用行為主義的方法訓練一個複雜的神經網絡,一定會產生越來越強的智能。今天的比賽,“星際指揮官”勝了;未來在其他應用領域,AI同樣會超過人類,強化學習在開放環境下所發揮的作用一定會越來越強,一定會在廣泛領域發揮作用,這是人工智能發展的必然結果。

  通用人工智能技術將指數級發展

  Q:智能體已經應用在哪些實際場景中?未來人工智能技術將如何發展?

  袁泉:回首4年前,AlphaGo戰勝柯潔,帶給我們很大的震撼,新一代的具備自我學習、自主決策能力的智能體正式走上歷史舞台,在我們看來這或許就是人工智能技術的拐點,也讓我們思考下一個時代最重要的是什麼。

  三年前,啓元世界以《星際爭霸》為研究環境,開展智能體的研究。今天,24歲的《星際爭霸》遊戲,與年輕的星際職業選手和3歲的“星際指揮官”,為大家帶來了一場精彩的對戰。我們也希望把《星際爭霸》中誕生的智能體,帶到每個行業、每個家庭、每個個人身邊,成為新一代的智能化生活基礎設施。

  今天,啓元世界的智能體已經在各行業“搖身一變”,成為交通調度員、理財顧問和服務機器人,深入產業端解決博弈、優化、控制等複雜環境下的動態決策問題;也能夠成為可以學習和模仿人類行為的虛擬玩家和虛擬角色,打造個性化的、沉浸式的娛樂體驗。

  相信未來幾年,以深度強化學習為代表的通用人工智能技術還將呈指數級增長。

  決策智能技術從虛擬跨越到現實,解鎖更多商業場景

  Q:技術的進步可以解鎖更多商業場景,那麼智能體技術將解鎖哪些商業場景?

  嶽斌:2014年,我們認為新技術方向的投資應該all in人工智能,當時更多投資的是機器視覺領域的公司。2016年,AlphaGo的出現徹底打開了我們的思維方式,我們看到了完全不同的一個世界。

  如今,決策智能技術已經在虛擬世界中實現了大量的應用,有些是在我們不經意間發生的。比如當我們使用搜索引擎的時候,出來的結果很有可能已經通過決策智能做出排序;決策智能技術也已經被大量運用到電商領域,比如很多商品會根據我們的喜好推薦;在谷歌的機房,也使用相關技術調控機房温度、實現節省能耗的運轉。

  今天來自中國、韓國等國家的頂尖圍棋選手,都在借用圍棋AI進行訓練;也有不少遊戲玩家喜歡在遊戲裏選擇與AI過招,可以找到適合自己難度的AI、從而獲得提高。

  決策智能技術在虛擬世界裏被廣泛應用之後,我們對未來最大的期待就是決策智能技術如何從虛擬跨越到現實。比如在出行等調度平台不斷應用;醫療領域近期較大的突破是做蛋白質摺疊的預測;如果可以被用到自動駕駛領域,未來的出行將會發生巨大改變。

  隨着未來相關技術在更多決策場景裏超越人類,相信將給人類帶來更多福利。

  決策智能技術正應用在出行領域的複雜預測場景中

  Q:在智能交通的規劃中,決策智能技術可以產生怎樣的價值?

  章文嵩:大家都坐過網約車,滴滴的派單就是一個智能決策的過程。過去有一個最簡單的算法是就近派單,但這樣的派單算法不是最優的。比如一輛車離一位乘客2公里,但1毫秒之後,突然冒出一位乘客離車只有100米,顯然派單給2公里的乘客就不是最優決策,所以必須要對未來做預測,是一個複雜的決策過程。因此,我們使用了人工智能技術、大數據、雲計算等進行決策,不斷提升乘客的安全、體驗和效率。

  如今滴滴的決策智能技術已經在很多預測場景中不斷實踐,比如對距離和接駕時間進行時空預測、對路況和路徑規劃做預測、對供需做預測等等。

  高度擬人的智能體將深刻改變數字娛樂產業

  Q:智能體在數字娛樂場景中,未來能夠給用户帶來哪些創新體驗?

  嚴強:我看過“星際指揮官”的1.0版本,今天的比賽結果讓我看到他從原來一個“小孩”今天成長到“成年狀態”,非常驚喜和感動。

  快手本質上做的是對內容的理解,以及人和內容的匹配。對於內容和數字娛樂產業,可以利用智能技術做很多探索。比如虛擬機器人、虛擬陪伴、虛擬玩家,能夠給人們帶來以前不曾有過的體驗。

  還有一個特別重要的方向,如今大家越來越多的時間沉浸在數字世界裏,如果人類可以通過與機器的互動,在數字世界的交互過程中實現自我成長,這將是一項非常偉大的事業。

  我非常期待“星際指揮官”能成為一位翩翩少年,成為幫助產業和未來數字世界更好發展的助推者。

  5年後,智能體將如何改變我們的生活

  Q:未來5年,智能體會如何改變我們的生活?可以設想一個腦海中的場景分享。

  數字世界大腦智能將被更多智能體所替代

  黃鐵軍:在我看來,5年後必然會發生的是——物理世界會越來越數字化,網絡化程度越來越強,大家信息交互的速度越來越快。

  在這背後,數字世界的決策智能一定會越來越多,甚至絕大多數場景都將被智能體所接管。因為智能體速度更快、效率更高,相比之下人類的思考速度較慢,而且代價較高。比如靠人去做紅綠燈調度或者自動駕駛的調度,從成本上都不如用智能體去做。數字世界的大腦智能將越來越多地被智能體所替代。

  我給大家的建議是做好心理準備,我們已經走上了一個快車道,人工智能的影響將越來越大。

  有生之年駕駛宇宙飛船帶我們去火星的應該是AI

  袁泉:未來我們應該可以更好地解析和理解智能體。今天智能體很強,但不一定被人完全解析和理解了。前一陣我看《道德經》,道可道、非常道,AI在用其方式讓我們感知到。包括有星際職業選手在和“星際指揮官”對戰的時候,感覺AI有兩個腦,可能是大腦和小腦彼此配合的,分別負責宏觀策略和微觀操作。現階段受限於我們對AI的理解和技術的發展,這種真實的交互感還無法完全用人可理解的方式解釋出來。

  而在更遠的未來,我自己是很相信有生之年可以站在火星上的。我希望到時駕駛宇宙飛船帶我們去火星的應該是AI,在茫茫太空中駕駛飛船,AI的駕駛水平應該比人類更強、更安全。在非常廣袤的空間和不確定的環境中去探索和決策,應該是AI的能力與強項。

  AI有可能成為人類面對疫情等重大健康安全事件的武器

  嶽斌:過去幾年我們在科技領域做了非常長線的投資,包括我們認為可以在至少10年以上的時間維度裏對人類起到非常重要意義的技術,從中也看到了很多新的可能性和場景。

  在今天這樣一個特殊的時期,新冠疫情的影響超越人類能力,在短時間內很難找到解決方法。因此讓我説對未來5年智能技術驅動場景的期待,我比較期待在醫療和生命健康方面的應用。

  比如現在正在進行的CASP全球競賽中,大家在用AI技術嘗試做蛋白質結構預測。我希望未來5年之內,在與人類生命息息相關的領域裏,AI能夠取得巨大的進展。在人類面對整個種族的重大健康安全事件時,我們有更多武器可以破除碰到的困難。我相信5年的時間是有機會的。

  自動駕駛一定會大規模商業化落地

  章文嵩:如果選未來一個場景,我首選肯定是自動駕駛。未來5到10年,自動駕駛一定會商業化落地,而且是大規模的落地。

  有了自動駕駛之後,交通系統的確定性會更高,效率也會更高,出行將變得更加安全。10年後,有可能所有的交通工具都變成自動駕駛,車與車之間緊密連接,就像一列小火車或者高鐵一樣,甚至是直接平移到不同的陸地上,交通效率將會得到大幅度提升。有可能紅綠燈都將不復存在,人們通過一些協議協商誰先走。

  所以10年後的交通將與今天完全不一樣,交通的變革才剛剛開始。

  數字世界有更多虛擬朋友陪伴我們成長

  嚴強:在未來世界裏,每個人都會有自己的虛擬偶像和虛擬朋友,我相信這件事會非常快實現。

  比如今天在中日韓有越來越多的虛擬偶像出現,本質上就是智能體的一種形式,而未來這些智能體將會更加具有社交屬性。

  疫情之後,大家可能會發現現實生活中的朋友越來越遠,人們的孤獨感越來越強。

  而機器、尤其是智能體,在很多時候甚至能夠比人更加理解人,他們將成為未來生活中不可缺少的部分。可能是我們的朋友,也有可能是我們的老師,甚至是我們的對手,在未來世界陪着我們成長。

  也就是説,在數字世界裏可以有很多更加智能的虛擬朋友陪着我們,這是在娛樂和社交領域會發生的比較大的變化。