金磊 豐色 發自 凹非寺
量子位 | 公眾號 QbitAI
元宇宙的本質是物理和數字兩個世界的融合,“鑄魂”是關鍵。
這,便是AI科學家對於元宇宙所持的最新觀點。
他叫田奇,是計算機視覺、多媒體信息檢索專家,國際歐亞科學院院士,IEEE Fellow。
而他更為大眾所熟知的身份,是華為雲人工智能領域首席科學家。
在田奇看來,元宇宙已經實現了“盤古開天”。下一階段,數字人將成為元宇宙的核心要素。
而且在這位AI大牛眼中,元宇宙已然不再是獨立的一片天地,而是物理世界和數字世界的融合體——融合,是元宇宙的關鍵詞。
更進一步的,田奇認為,預訓練大模型是幫助元宇宙更好地實現“融合”的關鍵技術。
如何用大模型給數字人“鑄魂”?近兩年,像BERT、GPT-3等大規模預訓練模型逐漸走進大眾的視野,其“大力出奇跡”的優異效果為AI技術的發展應用帶來了極大的想象空間。
與此同時,隨着Facebook正式更名為Meta,元宇宙的熱潮也被推向了前所未有的高度。
那麼當最潮的AI技術遇上最In的熱門領域,又會擦出怎樣的火花?
在田奇看來,二者的相遇會讓元宇宙的核心要素——數字人,能夠在形象上“以假亂真”,甚至可以具備與人類媲美的智慧。
首先,田奇介紹了數字人智能的表現,以及如何通過技術讓數字人更聰明。
他認為,數字人的智能可以分為感知和認知兩個方面。
感知智能的核心在於讓數字人具備人的視覺、聽覺、觸覺等感知能力,並且與自然界進行交互。
譬如,基於語音大模型,數字人可以擁有聽覺;基於語言大模型,數字人可以具備流暢對話的能力;基於視覺大模型,數字人能夠看見周圍環境並與之進行互動……
田奇認為,數字人若是結合上一些特殊信號,甚至可以衍生出人類所不具備的超感知能力,以輔助人類探索更多突破想象的技術,比如“千里眼”、“順風耳”等。田奇表示,這在今天已完全可以實現。
在認知智能方面,數字人應當側重於信息整合、推理、創造等能力,這正是人類區別於其它生物的關鍵所在。
田奇牽頭打造的華為雲盤古大模型便可以讓數字人具備更強的認知能力。
△2021 HDC.Cloud中現場演示田奇:什麼樣的車沒有油也可以跑?
盤古:新能源車和自行車沒有油都可以跑。當然,還有玩具車。
田奇:什麼是碳中和?碳排放主要來自於哪些行業?
盤古:碳中和就是把人為排放的二氧化碳,通過植樹造林、節能減排等形式抵消掉,從而使得釋放到大氣中的總碳量淨值為零。目前發電和供熱行業、製造和建築業是主要的碳排放行業。
……
在這段流暢且出乎意料的對話中,盤古的常識推理等能力展露無遺。
總而言之,利用預訓練大模型的海量參數來模擬人類超大腦容量,並且用海量數據驅動模型去認識和理解世界,是田奇非常看好的技術之一。
因為大模型就像是一個強勁的馬達,為數字人在感知智能和認知智能方面的進步提供了強大的推動力。
而除了智能之外,超寫實的外觀也是數字人的重要發展方向。
在這一方面,AI技術與華為雲MetaStudio能夠讓數字人的形象和真人“傻傻分不清”。
具體而言,在“學習”了大量的人類照片和實際採集的皮膚信息後,再經過簡單的訓練,AI就能夠打造皮膚材質模型,接着MetaStudio則能夠更加快速地渲染出近似真實質感的皮膚。
再比如,通過AI表情的訓練,可以獲取更豐富的表情驅動模型,讓數字人的表情效果更自然。
除此之外,理想的數字人“塑形”工作應當採用“極簡模式”。例如傳統方式往往需要走遍完整的一條“路徑”:從原畫到建模、渲染,中間有瑕疵時還需要手動來調整。
但AI能力的介入,不僅僅會讓這個過程變得智能化、提高效率,還能以1個模板為基礎,生產出多種不同風格的數字人,例如超寫實和卡通風格。
……
以上便是田奇眼中對元宇宙數字人“鑄魂”和“塑形”的過程了。
除了數字人這一核心要素外,田奇從更為宏觀的角度,分享了他對於元宇宙的更多理解。
融合,是元宇宙的關鍵元宇宙代表了人類社會對於虛擬和現實進一步融合的期待和嚮往。
田奇解釋道,元宇宙既非我們表面理解的完全“脱實向虛”,也非平行於現實世界。
它的本質是物理和數字兩個世界的融合。
而這個“融合”包括物理世界數字化和數字世界現實化兩方面。
怎麼理解這兩個概念?
舉個例子。
如果我們想要預防颱風災害,就可以通過數字孿生,來模擬全球的氣候流動和洋流流動。
通過這個數字世界的模型,我們就可以推斷颱風的運行軌跡,以及對沿途區域可能造成的災害影響,從而進行預防,減少損失。
也就是説,元宇宙先將物理世界數字化,再利用這個數字化世界幫助解決現實世界的問題,兩個世界相輔相成,融為一體。
在這個融合世界中,不光人有智慧,路邊的樹木、房屋……都有智慧,它們都可以觀測、記錄、計算數據,並對現實世界作出一定的反饋和影響。
那麼從AI技術的角度來説,這兩者最關鍵的技術是什麼呢?
田奇認為,對於物理世界數字化,對現實世界的識別和理解最為重要,比如用攝像頭、傳感器等設備採集場景和人物信息時涉及到的識別、分類和分割等視覺算法,就是其中的核心技術。
在完成對物理世界的識別和理解後,就該重建了。
田奇表示,目前的技術在二維圖像生成方面已經達到了比較好的效果,未來要做的就是對開放場景、三維物體的建模技術進行突破。
而三維物體的建模難度大,需要巨大算力,也需要眾多高校等科研力量共同構建大規模的數據集。
對於數字世界現實化,這裏面的關鍵便是如何將數字內容與現實世界進行無縫地疊加渲染。
我們需要把現有的風格化技術進一步擴展到更大的三維場景中,並與視覺理解的結果結合起來,進行更精細的效果展示。
田奇補充道,風格遷移在這裏的作用是帶來二次創作,增強虛擬世界的吸引力。
比如我們可以思考:如何把現在的西安街景渲染為古代長安的風格。
説完元宇宙的關鍵,我們又該如何進行落地呢?
元宇宙技術架構田奇認為,一般來講,可以把元宇宙的技術架構分為四層:聯接層、平台層、交互層和應用層。
所謂聯接層,主要作用就是聯通物理和數字世界,涉及光纖、5G、WiFi6等網絡技術。在滿足大帶寬、低時延、高可靠等需求的同時,聯接層還要保障所有設備、終端能夠快速接入業務。
而平台層擁有基於雲+AI的基礎設施,是物理世界向虛實融合世界轉型的關鍵底座。
它通過對複雜系統建模、實時仿真、渲染,將物理世界簡單、快速、逼真地映射到數字世界,也就是做到我們所説的“數字孿生”。
具體來説,其映射包括環境和人物兩個方面,前者涉及三維物體的建模和渲染,後者則需要某些AI技術來輔助完成人物動作和表情的重構。
在這一層,數字世界反作用於物理世界,提升物理世界的生產效率。
而這取決於其中的智能化水平。田奇表示,大模型、求解器、知識計算是提升智能化水平的關鍵。
最後,平台層還有一個顯著特點,那就是各種雲服務和AI能力均以服務化方式對外提供,做到隨時隨地、按需獲取。
這也與華為雲近年來提出的“一切皆服務”的理念一脈相承。
第三層的交互層很好理解,就是虛實融合世界的窗口。但要做到虛實結合、看得清晰、交互自然和戴得舒服四種基礎體檢,才能讓普通人願意去看、去了解元宇宙。
需要注意的是,這裏的交互不僅只是從2D走向3D,還有從間接交互走向直接感知交互。
同時在這層,除了更先進的硬件設備,AI技術同樣也可以輔助提升我們的體驗。
比如目前業界的動畫或影視製作公司的動作輔助重建等技術,如果能把門檻降低到大眾化,就可以很好的彌補設備的上不足。
最後一個應用層則將通過開放合作,打造如自動駕駛仿真訓練、智能工廠仿真優化、智能城市孿生等應用,徹底重構數字世界的價值和體驗。
元宇宙應為民生和社會服務説到應用,田奇強調,未來元宇宙的應用行業和場景並不能侷限於遊戲和娛樂,還應該在更廣泛的領域為人類民生和社會服務。
比如教育和醫療。
在教育方面,田奇認為我們最關心的兩點其實是教育質量和覆蓋範圍。
而元宇宙恰恰最能從這兩點進行賦能:
既能拓展教育的表現力,營造沉浸感很強的親身體驗,提升教育質量;又因為有數字人和虛擬世界的加持,具備很強的可複製性,因此就能覆蓋更廣大的人羣,從而改善教育資源的不平等問題,甚至引起人類教育方式的變革。
醫療方面,由於全球範圍內都存在嚴重的醫療資源不平等問題,我們就可以利用元宇宙技術進行虛擬線上問診和智能分診,讓患者與醫生的虛擬化身進行面對面的溝通,進行多角度的細緻觀察。
這樣既能提升患者的就醫體驗,也能緩解醫療資源的緊張與不均衡,讓欠發達地區也能享受最為優質的醫療資源。
因此,田奇認為擁有技術能力的科技公司,應在推動元宇宙建設過程中具有超越經濟利益的人文關懷意識和社會擔當。
除了上面提到的這些,還有很多行業或場景都可以“塞”進元宇宙,甚至可以説是“萬物皆可元宇宙”。
再比如從經濟效益來看,田奇認為廣告行業可能會有巨大顛覆。
他解釋道,相比傳統的廣告在固定場景進行的無差別展示,以及在手機等設備上進行的個性化推薦,元宇宙裏的廣告將會“更進一步”。
一是屏幕的變化,藉助近眼顯示等設備,數字信息和廣告將會呈現在任何地方,比如天空、建築,甚至路人的衣服……
二是在元宇宙中數字信息將會做到更加“千人千面”,每個人看到的東西都會不一樣。
更重要的是,獲取這些信息的方式也將由“給我看什麼”變成“我想看什麼”,個人在信息的獲取方面將更加具有主動性。
元宇宙如何防沉迷?元宇宙作為新鮮事物,能高度滿足我們在現實中感受不到的體驗,但其誕生也可能會帶來一些問題,如用户沉迷、知識產權、隱私安全等。對此,田奇認為:
在元宇宙建設過程中光有計算機科學家和工程師的參與勢必是遠遠不夠的,還需要政府機構、社會學家、經濟學家、倫理學家、法學家等各種角色的參與。
比如當我們面對用户沉迷問題時,各界專家學者就可以從技術和法規兩個層面來進行解決:
在技術層面,完善防沉迷系統設置;在法規層面,聯合遊戲開發商、遊戲運營商、設備商和社會組織等共同推進防沉迷系統建設。
再比如,在元宇宙中需要對創作者的知識產權進行保護,而這也需要監管部門進行配合。
此外,田奇表示,未來的元宇宙很可能是去中心化的,在平台中,如何保證內容受到道德和法律的約束,不冒犯自然人的權利和價值觀,不對性別、種族、地域、民族、年齡、收入、宗教等因素產生偏見……都是非常重要的課題。
“我們需要預先設想風險點,然後制定監管標準和措施。”田奇總結道。
至於“去中心化”是不是一個好的做法,他認為,可以再探討,但還是監管和引導最重要。
田奇:共同合作才能創造元宇宙的未來田奇2018年加入華為,後加入華為雲,擔任華為雲人工智能領域首席科學家。
在20多年的研究生涯中,田奇博士始終專注於圖像內容理解這一計算機視覺領域的核心問題,並先後在大規模圖像檢索、行人重識別、自動化機器學習,預訓練大模型等方面做出了一系列具有深遠影響的研究工作。
基於田奇在學界和產業界的長期積累,同時由於其主導開發的盤古預訓練大模型在中國人工智能技術創新及應用領域具有較大影響力,2021年,他被授予“吳文俊人工智能傑出貢獻獎”。
如今,對於元宇宙這個有人看好有人唱衰的概念,他認為:
對技術的看法存在爭議非常正常,而總的來説,我看好元宇宙的長遠發展。
究其原因,他表示,互聯網發展至今,就是一個越來越數字化的過程。
也就是説,元宇宙並非突然“石頭縫裏突然冒出”的一個概念,而是技術發展的必然過程。
而AI技術和元宇宙之間的關係,是相輔相成,互相促進的,AI技術在帶動元宇宙建設的同時,也必將極大地促進自身的快速發展。
最後,對於未來元宇宙的建設問題,田奇表示:
由於涉及的概念實在太廣,最重要的就是根據華為雲自身開發團隊的能力,找到高價值的應用場景,並與各地夥伴進行各種形式的技術合作——不僅僅是數字人,也包括元宇宙所需的各種基礎智慧能力。
大家發揮所長,優勢互補,才能共同創造數字世界的未來。
— 完 —
量子位 QbitAI · 頭條號簽約