6月21日,在2020北京智源大會——啟元星際AI頂級職業選手挑戰賽上,啟元世界自主研發的智慧體“星際指揮官”,以兩個2:0的成績,擊敗了《星際爭霸I/II》全國冠軍黃慧明(TooDming),以及黃金總決賽三連冠選手李培楠(Time)。
這是中國星際AI首次在公開比賽中戰勝國內頂級職業選手。也讓人們充分看到智慧體在長期策略規劃、非完全資訊博弈、超大規模動作空間等複雜決策問題上展現出的強大決策智慧能力。
所謂智慧體,是具備自我學習、自主決策能力的主體,表現為數字人或機器人。
在“星際指揮官”達到人類頂級職業選手水平之後,行業更加期待智慧體從虛到實遷移,在現實世界中落地應用,從“西部世界”走向各行各業。
智慧體已經有哪些實際的商業化應用?未來5-10年,智慧體會如何改變我們的生活?智慧體將以何種速度進化,並不斷激發我們探索未知地帶?
在賽事之後的行業研討環節,北京智源人工智慧研究院院長、北京大學黃鐵軍教授,啟元世界CEO袁泉,高榕資本創始合夥人嶽斌,滴滴出行高階副總裁章文嵩,以及快手高階副總裁嚴強,共同探討了智慧體在現實產業和虛擬世界中應用的當下與未來。
高榕資本榕匯作為特別支援夥伴,將這場充滿技術想象力的對話實錄分享出來。
以下為研討實錄精編:
決策智慧的無盡疆域與現實應用
智慧科學是無盡疆域
Q:在與人類頂尖職業選手的對戰中,啟元“星際指揮官”的表現超出了所有人的預期,且僅用頂尖科技公司1%的算力,展現出世界一流的演算法原創和工程實踐能力。如何看待智慧技術的發展前景?
黃鐵軍:從事自然科學的人經常說一句話,腦科學是自然科學最後的疆域,人的大腦是最難破解的未知地帶。
而在這之後,智慧科學是無盡的疆域。人類智慧是億萬年進化的產物,機器智慧雖然只有上百年的進化過程,但是進化速度很快。我們沒有任何理由認為機器智慧不會超過人,因為人類智慧也是在自然環境裡反覆訓練出來的。
今天啟元的“星際指揮官”,已經在《星際爭霸》遊戲這樣複雜的環境中訓練出很強的智慧;而在未來越來越複雜的訓練環境中,機器智慧水平一定會越來越高。複雜到什麼程度?宇宙就是一個複雜的物理環境,對宇宙的探索,是由緩慢進化的人類完成?還是由高速進化的機器完成?這是值得思考的一個重大問題。
總得來說,我們今天已經走在正確的道路上,用行為主義的方法訓練一個複雜的神經網路,一定會產生越來越強的智慧。今天的比賽,“星際指揮官”勝了;未來在其他應用領域,AI同樣會超過人類,強化學習在開放環境下所發揮的作用一定會越來越強,一定會在廣泛領域發揮作用,這是人工智慧發展的必然結果。
通用人工智慧技術將指數級發展
Q:智慧體已經應用在哪些實際場景中?未來人工智慧技術將如何發展?
袁泉:回首4年前,AlphaGo戰勝柯潔,帶給我們很大的震撼,新一代的具備自我學習、自主決策能力的智慧體正式走上歷史舞臺,在我們看來這或許就是人工智慧技術的拐點,也讓我們思考下一個時代最重要的是什麼。
三年前,啟元世界以《星際爭霸》為研究環境,開展智慧體的研究。今天,24歲的《星際爭霸》遊戲,與年輕的星際職業選手和3歲的“星際指揮官”,為大家帶來了一場精彩的對戰。我們也希望把《星際爭霸》中誕生的智慧體,帶到每個行業、每個家庭、每個個人身邊,成為新一代的智慧化生活基礎設施。
今天,啟元世界的智慧體已經在各行業“搖身一變”,成為交通排程員、理財顧問和服務機器人,深入產業端解決博弈、最佳化、控制等複雜環境下的動態決策問題;也能夠成為可以學習和模仿人類行為的虛擬玩家和虛擬角色,打造個性化的、沉浸式的娛樂體驗。
相信未來幾年,以深度強化學習為代表的通用人工智慧技術還將呈指數級增長。
決策智慧技術從虛擬跨越到現實,解鎖更多商業場景
Q:技術的進步可以解鎖更多商業場景,那麼智慧體技術將解鎖哪些商業場景?
嶽斌:2014年,我們認為新技術方向的投資應該all in人工智慧,當時更多投資的是機器視覺領域的公司。2016年,AlphaGo的出現徹底打開了我們的思維方式,我們看到了完全不同的一個世界。
如今,決策智慧技術已經在虛擬世界中實現了大量的應用,有些是在我們不經意間發生的。比如當我們使用搜索引擎的時候,出來的結果很有可能已經透過決策智慧做出排序;決策智慧技術也已經被大量運用到電商領域,比如很多商品會根據我們的喜好推薦;在谷歌的機房,也使用相關技術調控機房溫度、實現節省能耗的運轉。
今天來自中國、韓國等國家的頂尖圍棋選手,都在借用圍棋AI進行訓練;也有不少遊戲玩家喜歡在遊戲裡選擇與AI過招,可以找到適合自己難度的AI、從而獲得提高。
決策智慧技術在虛擬世界裡被廣泛應用之後,我們對未來最大的期待就是決策智慧技術如何從虛擬跨越到現實。比如在出行等排程平臺不斷應用;醫療領域近期較大的突破是做蛋白質摺疊的預測;如果可以被用到自動駕駛領域,未來的出行將會發生巨大改變。
隨著未來相關技術在更多決策場景裡超越人類,相信將給人類帶來更多福利。
決策智慧技術正應用在出行領域的複雜預測場景中
Q:在智慧交通的規劃中,決策智慧技術可以產生怎樣的價值?
章文嵩:大家都坐過網約車,滴滴的派單就是一個智慧決策的過程。過去有一個最簡單的演算法是就近派單,但這樣的派單演算法不是最優的。比如一輛車離一位乘客2公里,但1毫秒之後,突然冒出一位乘客離車只有100米,顯然派單給2公里的乘客就不是最優決策,所以必須要對未來做預測,是一個複雜的決策過程。因此,我們使用了人工智慧技術、大資料、雲計算等進行決策,不斷提升乘客的安全、體驗和效率。
如今滴滴的決策智慧技術已經在很多預測場景中不斷實踐,比如對距離和接駕時間進行時空預測、對路況和路徑規劃做預測、對供需做預測等等。
高度擬人的智慧體將深刻改變數字娛樂產業
Q:智慧體在數字娛樂場景中,未來能夠給使用者帶來哪些創新體驗?
嚴強:我看過“星際指揮官”的1.0版本,今天的比賽結果讓我看到他從原來一個“小孩”今天成長到“成年狀態”,非常驚喜和感動。
快手本質上做的是對內容的理解,以及人和內容的匹配。對於內容和數字娛樂產業,可以利用智慧技術做很多探索。比如虛擬機器人、虛擬陪伴、虛擬玩家,能夠給人們帶來以前不曾有過的體驗。
還有一個特別重要的方向,如今大家越來越多的時間沉浸在數字世界裡,如果人類可以透過與機器的互動,在數字世界的互動過程中實現自我成長,這將是一項非常偉大的事業。
我非常期待“星際指揮官”能成為一位翩翩少年,成為幫助產業和未來數字世界更好發展的助推者。
5年後,智慧體將如何改變我們的生活
Q:未來5年,智慧體會如何改變我們的生活?可以設想一個腦海中的場景分享。
數字世界大腦智慧將被更多智慧體所替代
黃鐵軍:在我看來,5年後必然會發生的是——物理世界會越來越數字化,網路化程度越來越強,大家資訊互動的速度越來越快。
在這背後,數字世界的決策智慧一定會越來越多,甚至絕大多數場景都將被智慧體所接管。因為智慧體速度更快、效率更高,相比之下人類的思考速度較慢,而且代價較高。比如靠人去做紅綠燈排程或者自動駕駛的排程,從成本上都不如用智慧體去做。數字世界的大腦智慧將越來越多地被智慧體所替代。
我給大家的建議是做好心理準備,我們已經走上了一個快車道,人工智慧的影響將越來越大。
有生之年駕駛宇宙飛船帶我們去火星的應該是AI
袁泉:未來我們應該可以更好地解析和理解智慧體。今天智慧體很強,但不一定被人完全解析和理解了。前一陣我看《道德經》,道可道、非常道,AI在用其方式讓我們感知到。包括有星際職業選手在和“星際指揮官”對戰的時候,感覺AI有兩個腦,可能是大腦和小腦彼此配合的,分別負責宏觀策略和微觀操作。現階段受限於我們對AI的理解和技術的發展,這種真實的互動感還無法完全用人可理解的方式解釋出來。
而在更遠的未來,我自己是很相信有生之年可以站在火星上的。我希望到時駕駛宇宙飛船帶我們去火星的應該是AI,在茫茫太空中駕駛飛船,AI的駕駛水平應該比人類更強、更安全。在非常廣袤的空間和不確定的環境中去探索和決策,應該是AI的能力與強項。
AI有可能成為人類面對疫情等重大健康安全事件的武器
嶽斌:過去幾年我們在科技領域做了非常長線的投資,包括我們認為可以在至少10年以上的時間維度裡對人類起到非常重要意義的技術,從中也看到了很多新的可能性和場景。
在今天這樣一個特殊的時期,新冠疫情的影響超越人類能力,在短時間內很難找到解決方法。因此讓我說對未來5年智慧技術驅動場景的期待,我比較期待在醫療和生命健康方面的應用。
比如現在正在進行的CASP全球競賽中,大家在用AI技術嘗試做蛋白質結構預測。我希望未來5年之內,在與人類生命息息相關的領域裡,AI能夠取得巨大的進展。在人類面對整個種族的重大健康安全事件時,我們有更多武器可以破除碰到的困難。我相信5年的時間是有機會的。
自動駕駛一定會大規模商業化落地
章文嵩:如果選未來一個場景,我首選肯定是自動駕駛。未來5到10年,自動駕駛一定會商業化落地,而且是大規模的落地。
有了自動駕駛之後,交通系統的確定性會更高,效率也會更高,出行將變得更加安全。10年後,有可能所有的交通工具都變成自動駕駛,車與車之間緊密連線,就像一列小火車或者高鐵一樣,甚至是直接平移到不同的陸地上,交通效率將會得到大幅度提升。有可能紅綠燈都將不復存在,人們透過一些協議協商誰先走。
所以10年後的交通將與今天完全不一樣,交通的變革才剛剛開始。
數字世界有更多虛擬朋友陪伴我們成長
嚴強:在未來世界裡,每個人都會有自己的虛擬偶像和虛擬朋友,我相信這件事會非常快實現。
比如今天在中日韓有越來越多的虛擬偶像出現,本質上就是智慧體的一種形式,而未來這些智慧體將會更加具有社交屬性。
疫情之後,大家可能會發現現實生活中的朋友越來越遠,人們的孤獨感越來越強。
而機器、尤其是智慧體,在很多時候甚至能夠比人更加理解人,他們將成為未來生活中不可缺少的部分。可能是我們的朋友,也有可能是我們的老師,甚至是我們的對手,在未來世界陪著我們成長。
也就是說,在數字世界裡可以有很多更加智慧的虛擬朋友陪著我們,這是在娛樂和社交領域會發生的比較大的變化。