索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

魚羊 博雯 發自 凹非寺

量子位 | 公眾號 QbitAI

今天,索尼真是背刺了一把任天堂。

早上任天堂在直面會上公佈了諸多遊戲大作:異度之刃3、火焰紋章無雙、馬里奧前鋒……可謂佔盡風頭。

然而,萬萬沒想到,索尼的3A遊戲大作居然搞了個更大的新聞,登上了Nature封面。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

把遊戲宣發做到了頂級學術期刊封面,我服。

不過這篇文章可不是加錢打廣告,而是實實在在的技術論文——

一隻來自索尼的AI,名叫GT Sophy

且看這位AI賽車手的比賽畫面,先是一個機智變道繞開對手的卡位:

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

隨後在彎道膠著時大秀操作,以190km/h的速度一舉反超,將對手甩到身後。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

可別覺得AI在賽車遊戲裡戰勝人類沒啥特別的,要知道,這樣的比賽是在GT賽車中進行的——

這是一款高度擬真的賽車遊戲,也就是說,選手們幾乎就是在真·開車。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

△圖右為GT世界冠軍Takuma Miyazono

而GT Sophy也是世界上首個在此類需要持續判斷和高速反應的賽車遊戲中,戰勝人類冠軍的AI。

斯坦福汽車研究中心聯合主任Chris Gerdes教授就對此表示:

GT Sophy在比賽中如此熟練地超越人類駕駛員,這對於人工智慧而言是一項里程碑式的進步。

值得一提的是,最新一代GT系列遊戲Gran Turismo 7將在3月4日正式登陸PS4/PS5平臺。

雖然玩家們不太可能在第一時間對戰GT Sophy,但索尼已經表示,他們正在努力將這隻強大的AI整合到GT賽車中。

並不簡單的賽車AI

AI戰勝人類,在很多人聽來已經不夠新鮮。

但與過去在國際象棋、圍棋等棋類遊戲,或星際爭霸、Dota等動作遊戲中一展拳腳的AI相比,賽車那看似“先到終點就贏”的簡單目標,實際上要複雜得多:

比如剎車,就是一種不斷探索汽車輪胎與道路之間摩擦力的“物理戰”。

轉彎時剎車太早,可能就無法順利過彎,還會損失車速;

剎車太晚,又難以保持想要的路線軌跡,甚至導致車體旋轉。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

整個比賽過程中,賽車手必須時刻保持對周圍環境的判斷,並能根據路況作出及時的反應。

同時,駕駛技巧、針對不同對手的戰術策略、甚至是遵守規則的賽車精神和禮儀……都是一個賽車AI所必備的素養。

為了達成這些目標,索尼將AI的訓練場設在了自家的GT賽車系列的遊戲中。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

這是一款PS平臺獨佔遊戲,全名Gran Turismo,是一個汽車行業中的真實名詞,意為“能夠長距離行駛的高效能車”。

這款遊戲主打的就是真實駕駛感,甚至可以透過一套帶力反饋的方向盤外設體會到橫向g值、前輪滑移率、車重、車輛的調教特性等各種細膩的路感反饋。

在GT遊戲中,研究這種通常使用10到20臺PS遊戲機、同等數量的計算例項、一臺非同步更新神經網路的GPU,從頭開始訓練這個叫做GT Sophy的AI。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

訓練主要針對兩個連續值的維度:轉向和速度。

同時,為了把GT Sophy和人類拉到同一起跑線上,研究者們還調慢了它的操作速度:

對遊戲的互動頻率為10赫茲(人類標準是60赫茲),反應時間則分別為100毫秒、200毫秒、250毫秒。

在一張完整的地圖中,研究者以6秒為單位,將智慧體所跑的賽道量化為一段一段的“靜態地圖段”,並將每一段賽道的左右邊緣和中心線編碼為60個等距的三維點:

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

訓練場準備好了,現在就是讓GT Sophy真正成為一名會轉彎、會思考的賽車手。

行為者- 評價者機制

索尼使用了一種新的深度學習演算法,也叫做量化迴歸的行為者-評價者(QR-SAC)方法。

AI智慧體會被扔到一個沒有指令的環境中,並根據評價者(也就是價值函式)的評估來選擇行動,並根據完成目標的結果而獲得獎勵或懲罰。

比如,智慧體會因為保持高速前進而獲獎勵,也會因為出界、撞牆或失去牽引力受到懲罰。

這種獎懲機制使智慧體迅速得到積極的反饋,慢慢開始熟悉在賽道上的行為。

事實上,GT Sophy只用了幾個小時就學會了在賽道上行駛,並很快就在Maggiore賽道上超越了17700名玩家:

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

但這種單純的速度,或者說賽道完成進度上的獎勵並不足以激勵智慧體贏得比賽。

因為如果對手速度足夠快,智慧體就完全可以透過跟隨並學習對手的“偷懶”的方式積累大量獎勵,最終也能完成目標。

於是,研究者們增加了“超車獎勵”,並且,相對於對手的距離的改變也會與獎勵積分成比例。

同時,賽車的碰撞上也有獎懲機制,研究人員設定了一種較為保守的獎勵:

在確保智慧體能以足夠強悍的駕駛風格贏得勝利的同時,也不至於會粗暴地將其他賽車趕出道路,而遭受真正的賽車規則的懲罰。

最終,GT Sophy在GT賽車比賽中勝過了2021年TGR GT杯冠軍、2020年國家杯世界冠軍和2021年亞軍、2018年國家杯亞洲/大洋洲冠軍等多位世界頂級賽車手。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

在比賽中,GT Sophy在三條賽道上都取得了第一名。

而在比賽中,它能夠執行幾種型別的轉彎,有效地利用漂移,擾亂後面車輛,攔截對手並執行其他緊急操縱。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

不過,研究者也提到,GT Sophy在戰略決策方面還存在著一些改進的空間:有時會在同一條跑道上留出足夠的空間,讓對手有機可乘。

索尼要用它開發自動駕駛

看到這裡,你覺得GT Sophy能力如何?

反正幾位世界級選手們是服氣了。

在GT賽車世界級賽事上斬獲三冠的宮園拓真(Takuma Miyazono)表示:

Sophy的速度非常快,單圈時間勝過了此前對最佳車手的預期。

——在其中一場比賽中,GT Sophy Rouge以5.8秒的優勢戰勝了第二名山中智明(2021年TGR GT杯冠軍),最快圈速為1:54.373,比山中快了2秒多。

而GT Sophy的能力顯然不僅僅能在遊戲中大殺四方。

斯坦福汽車研究中心聯合主任Chris Gerdes教授就指出,GT Sophy背後的AI技術,可以幫助開發自動駕駛汽車:

GT Sophy在賽道上的成功表明,有朝一日,神經網路在自動駕駛汽車軟體中的作用可能比現在更大。

目前,神經網路演算法在自動駕駛汽車軟體中主要負責跟蹤道路標記、感知障礙,控制軟體則仍依賴於人為設定的規則。

豐田研究所高階經理Avinash Balachandran也表示,“在賽車中應用機器學習和自主控制令人興奮”。

還有不少網友認為,這一AI或許與索尼新成立的電動汽車公司有關,或許再過幾年,這個AI就能在其自動駕駛技術中看到了。

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

當然對於索尼玩家來說,最期待的是:下個月上市的GT7能否加入這個最強AI?

索尼把賽車遊戲發上了Nature封面,這波宣傳我服了

好訊息是GT7仍會登陸上一代遊戲機PS4,沒買到PS5的玩家也能嚐嚐鮮了。

論文:

https://www.nature.com/articles/s41586-021-04357-7

參考連結:

https://sonyai.github.io/gt_sophy_public/

— 完 —

量子位 QbitAI · 頭條號簽約

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 2726 字。

轉載請註明: 索尼把賽車遊戲發上了Nature封面,這波宣傳我服了 - 楠木軒