阿里達摩院祭出“秘籍”,解決自動駕駛核心難點
4月下旬,阿里達摩院發佈了全球首個自動駕駛“混合式仿真測試平台”,採用虛擬與現實結合的仿真技術,引進真實路測場景和雲端訓練師,能夠提供最貼近實際道路狀況的模擬測試,並且模擬一次極端場景僅需30秒,系統每天虛擬測試里程可超過800萬公里,將大幅度提升自動駕駛AI模型訓練效率,加速邁進自動駕駛L5階段。
或許很多人看到這裏會覺得一臉茫然,但筆者卻對此無比激動,先不要着急,且聽我慢慢解析達摩院發佈的“仿真路測平台”意味着什麼。
要想了解這套平台的意義,首先要弄明白自動駕駛的實現方式。
簡單理解來説可以分為: 感知道路環境、處理數據並給出結果、控制車輛,其中最簡單的是控制車輛方面,因為如今絕大部分車輛的方向、油門、剎車都是電子化控制,所以想要執行明確命令並不難,而真正難點在於 感知道路環境和基於這些信息 做出正確的決策。
專業説法為:感知、融合、決策、控制。即通過傳感器將道路信息記錄下來、把信息整合分類送入計算單元、處理數據後做出抉擇、根據給出的決策控制車輛行駛。
難點即是感知、融合、決策階段。
儘管近兩年,自動駕駛經常被媒體所報道,但幾乎所有人爭執的焦點都在“激光雷達”“5G技術”“V2X”這幾個問題上,似乎大多數認為只要解決了“激光雷達成本”“5G技術普及”“V2X落地”等問題,完全自動駕駛就能迎刃而解。
錯,這種觀念其實與“我買了這款屏幕、鍵盤、鼠標就能上分”“我買了這個廚具就能做出好菜”差不多是一個邏輯。
激光雷達是傳感器,存在問題的地方在於其成本和體積,高昂的成本使其無法大規模應用於民用車,龐大的體積導致車輛不美觀也影響空氣動力學。儘管近些年激光雷達的成本在大幅下降,以及在保證性能情況下,體積越來越小,但一個傳感器硬件並非是決定自動駕駛發展的充分條件。
5G技術則可以與V2X歸位一類,5G技術本質上解決的是通訊速度和延遲問題,有5G技術的支持,V2X才能夠實現。而這兩者對自動駕駛的促進作用,在於通過大量車載、非車載的傳感器互相溝通,提供幾乎所有的環境信息,也就是環境感知的來源不再侷限於單個車輛,而是所有聯網的傳感器都是汽車的“眼”;另外一個作用則是,由於通信速度得到了保證,那麼信息處理單元也不再侷限於單一車輛的計算力,可以將感知數據傳輸至雲端處理器,而後將決策傳輸至車輛並執行,以此解決車載處理器算力不足的問題。
細心的你應該已經發現了,無論是5G還是V2X,本質上也只是能夠解決感知層面問題,並且由於目前車載算力已經足夠,其實雲計算的收益也不高,所以這些仍然不是自動駕駛的核心痛點。
注意,筆者並沒有説感知層面和算力層面不重要,因為沒有 足夠的信息輸入,就不足以得出正確判斷,而沒有 足夠的算力,就不足以在極短時間做出決策。
但是,信息不是越多越好,雖然信息越多,不確定性就會越少,但信息量一旦過了某個節點,其收益增速會逐漸下降,並且導致成本大幅上;同樣算力的過剩,除了成本大幅上漲之外,並不會帶來更多的益處。
那麼多少是足夠呢?
舉個例子,上學的時候,有的人翻一遍書最後考試就能拿到高分,而有些人翻了無數遍書,最後考試還是不理想。大家都是一雙眼睛、一對耳朵,最終卻成績不同,本質上是因為聰明程度或學習方法不同導致的。也就是説如果足夠聰明,那麼不需要太多的信息輸入,也能拿到不錯的成績,即對於人來説, 所謂的足夠,主要取決於聰明程度。
業界實現自動駕駛基本分為兩種方式:“強感知、強智能”和“弱感知、強智能”,後一種方式目前只有少數企業在採用,也就是以視覺方案為主的策略,代表是特斯拉;前一種則是絕大部分企業採用,擁有激光雷達、高精地圖等額外感知手段,提升“強感知”。
所謂的智能,即是 聰明程度,拋開硬件的算力不談,各家廠商真正角逐的賽場,其實在學習方法的提高方面,換句話説,也就是軟件層面的問題。 這其實就是為什麼現如今自動駕駛行業的發展,愈發偏向軟件研發公司,例如華為、達摩院等企業的入場。
自動駕駛,需要應對的道路情況極為複雜,因為除了固定的道路信息之外,每個人、車都具有極強的不確定性,可能發生的情況接近於“無限”。如果由程序員來界定車輛在何種情況下進行某種操作,那麼就是以“有限”對“無限”,根本沒有勝算。所以業界無一例外,在對信息的整合處理階段,都是採用人工智能的方式,對神經網絡進行訓練,通過深度學習的方式提高“智力”。
深度學習,是一種針對神經網絡的訓練方式。簡單理解,即是通過電子解構模擬了人類大腦的學習方式,通過大量“學習材料”對其進行訓練,即可使其獲得類似人類一樣認知世界和理解世界的能力。
並且當訓練到達一定級別時,就如同人類已經對周圍事物相當熟悉,此時你並不需要仔細觀察某物,或者需要多種信息交叉對比才能確定這玩意到底是啥,僅僅需要看一眼就能準確得知物體是什麼。自動駕駛領域對神經網絡的訓練,也能達到同樣的效果,一旦訓練程度足夠,那麼感知層面所需要的信息量就很少。
例如comma.ai在普通車型上,僅僅通過加裝一部普通手機作為感知和運算單元,加上自己寫的自動駕駛算法openpilot,就能較好實現L2.5級別自動駕駛。
創始人George Hotz是一位軟件天才、黑科,曾在2007年破解第一代iPhone,2009年破解iPhone 3GS,以及後來破解索尼PS3、PSN。曾在特斯拉AP團隊工作過,於2015年成立自己的人工智能公司comma.ai,專注於自動駕駛,利用神經網絡和機器學習研發了openpilot系統,通過手機作為感知傳感器和計算單元,實現L2.5級別自動駕駛。用户只需採購幾百刀的設備,即可將幾款指定車型變為L2.5級別自動駕駛車輛。
不過自動駕駛不同於考試,達到高分是不夠的,終極目標需要的是無限逼近滿分才行,畢竟汽車本質上是一台高速移動的“危險機器”,一個小錯誤都可能以生命為代價。
所以整個自動駕駛行業,從之前的硬件競爭,逐漸轉變為了機器學習競爭。也就是説,誰能更好更快地訓練自動駕駛AI,誰就具有真正的優勢和技術壁壘。達摩院發佈的自動駕駛仿真路測平台,就是為此服務的。
車輛所需的訓練數據,來源無外乎兩類: 模擬器、實際道路。
一般來説,車輛在初期訓練階段都是在模擬器中進行的,優勢在於可以24小時不停地進行學習,從而大幅提升基礎自動駕駛能力。但問題在於,模擬器中雖説可以針對不同的道路環境進行自定義設置,但仍然比不上實際道路的複雜狀況,也就是在模擬器中訓練完成,猶如應試教育畢業的學生,與社會仍然存在脱節。
如果採用實際道路數據,效果會好很多,但是實際道路數據需要大量行駛在普通公開道路的車輛,而到達這個級別的車輛只有一個:特斯拉。
根據2月底舉行的Scaled Machine Learning Conference中,特斯拉AI和視覺負責人Andrej Karpathy分享了最新的數據, 在AP啓用狀態下共行駛了30億英里,NOA啓用狀態下里程超過10億英里,自動變道執行超過20萬次,高級智能召喚使用次數超過120萬次。
特斯拉自家的大型計算機集羣項目Dojo可以將這些數據篩選整合,基於真實的路測信息對AP算法進行無監管訓練和優化升級。但這樣級別的規模和早於市場很多年的規劃,不是哪個自動駕駛企業都能做到的,無論是售出車輛規模還是軟件團隊進度。 例如投入自動駕駛長達十幾年之久的谷歌團隊Waymo至今的路測里程不過2000萬英里而已。
多家研究機構表示,自動駕駛車輛需要積累177億公里的實際路測數據,才能保證自動駕駛的安全性。 這樣就進入了死循環,自動駕駛的能力不夠,產品力就不足以有吸引力,那麼市場中行駛的自家車輛就少,而使用模擬器訓練又無法與實際路測訓練競爭。
所以達摩院發佈的自動駕駛仿真路測平台就派上用場了。
該平台能夠將現實的路況信息通過其他手段收集,並融合進模擬器環境中,也就是説神經網絡系統能夠得到比一般模擬器更加真實的訓練,能夠接近路測數據級別。該平台甚至通過算法模擬人類的不確定,對車輛進行隨機干預,模擬各種現實中奇怪的駕駛習慣以及場景。並且由於性能強勁,傳統極為複雜的場景需要僅1個月時間,而在達摩院這套平台中,僅需30秒即可完成複雜場景的構建和測試準備,每天可支持場景構建數量達百萬級別。整體訓練效率相比普通模擬器將提升百萬倍。
這無疑對於其他自動駕駛企業來説,是個天大的喜訊。
不過值得注意的是,這個平台就像一個高級培訓班,能夠獲得多少提升,還要看自己的算法優劣。因為本身深度學習本身並不複雜,一個略微懂Python的朋友也能夠自己玩,比如Chares 2.0系統就是國外一個博主自己針對GTA5遊戲,編寫的自動駕駛軟件,經過半年多的訓練優化,已經能夠在遊戲中實現相對不錯的效果。
但這東西就是入門簡單,精通難,想要提高效率、優化算法,是一件極其複雜的事情。這也是為什麼近幾年,有不只一家公司被特斯拉起訴,前員工將部分算法代碼“偷”到下家使用。
總結來説,自動駕駛發展道路上,硬件技術雖然重要,但只是門檻,真正的技術壁壘和難點,集中在自動駕駛神經網絡的訓練上。並且基於神經網絡的訓練模式,這種進步速度是超乎一般人想象的,最簡單的例子就是谷歌的Alpha Go僅用幾年時間,就擊敗了全球頂尖圍棋高手。
當然想要完全克服所有場景下適用的完全自動駕駛,還是需要大量工程師的長久努力,但如今自動駕駛的發展速度已經不能用日新月異來形容了,應該用每分每秒來計量。神經網絡系統無時不刻通過大量數據在“進化”,就相當於一個頂尖天才從不休息地在高效學習,其結果可想而知。
達摩院此次發佈的仿真路測平台或許很多人不在意,但是記住筆者的話,在不久的將來,或許你使用的自動駕駛系統就“畢業”於這裏。
點擊支持一下唄