阿里達摩院祭出“秘籍”，解決自動駕駛核心難點

2020-05-22由沈建伏發佈於科技

4月下旬，阿里達摩院發佈了全球首個自動駕駛“混合式仿真測試平台”，採用虛擬與現實結合的仿真技術，引進真實路測場景和雲端訓練師，能夠提供最貼近實際道路狀況的模擬測試，並且模擬一次極端場景僅需30秒，系統每天虛擬測試里程可超過800萬公里，將大幅度提升自動駕駛AI模型訓練效率，加速邁進自動駕駛L5階段。

或許很多人看到這裏會覺得一臉茫然，但筆者卻對此無比激動，先不要着急，且聽我慢慢解析達摩院發佈的“仿真路測平台”意味着什麼。

要想了解這套平台的意義，首先要弄明白自動駕駛的實現方式。

簡單理解來説可以分為：感知道路環境、處理數據並給出結果、控制車輛，其中最簡單的是控制車輛方面，因為如今絕大部分車輛的方向、油門、剎車都是電子化控制，所以想要執行明確命令並不難，而真正難點在於感知道路環境和基於這些信息做出正確的決策。

專業説法為：感知、融合、決策、控制。即通過傳感器將道路信息記錄下來、把信息整合分類送入計算單元、處理數據後做出抉擇、根據給出的決策控制車輛行駛。

難點即是感知、融合、決策階段。

儘管近兩年，自動駕駛經常被媒體所報道，但幾乎所有人爭執的焦點都在“激光雷達”“5G技術”“V2X”這幾個問題上，似乎大多數認為只要解決了“激光雷達成本”“5G技術普及”“V2X落地”等問題，完全自動駕駛就能迎刃而解。

錯，這種觀念其實與“我買了這款屏幕、鍵盤、鼠標就能上分”“我買了這個廚具就能做出好菜”差不多是一個邏輯。

激光雷達是傳感器，存在問題的地方在於其成本和體積，高昂的成本使其無法大規模應用於民用車，龐大的體積導致車輛不美觀也影響空氣動力學。儘管近些年激光雷達的成本在大幅下降，以及在保證性能情況下，體積越來越小，但一個傳感器硬件並非是決定自動駕駛發展的充分條件。

5G技術則可以與V2X歸位一類，5G技術本質上解決的是通訊速度和延遲問題，有5G技術的支持，V2X才能夠實現。而這兩者對自動駕駛的促進作用，在於通過大量車載、非車載的傳感器互相溝通，提供幾乎所有的環境信息，也就是環境感知的來源不再侷限於單個車輛，而是所有聯網的傳感器都是汽車的“眼”；另外一個作用則是，由於通信速度得到了保證，那麼信息處理單元也不再侷限於單一車輛的計算力，可以將感知數據傳輸至雲端處理器，而後將決策傳輸至車輛並執行，以此解決車載處理器算力不足的問題。

細心的你應該已經發現了，無論是5G還是V2X，本質上也只是能夠解決感知層面問題，並且由於目前車載算力已經足夠，其實雲計算的收益也不高，所以這些仍然不是自動駕駛的核心痛點。

注意，筆者並沒有説感知層面和算力層面不重要，因為沒有足夠的信息輸入，就不足以得出正確判斷，而沒有足夠的算力，就不足以在極短時間做出決策。

但是，信息不是越多越好，雖然信息越多，不確定性就會越少，但信息量一旦過了某個節點，其收益增速會逐漸下降，並且導致成本大幅上；同樣算力的過剩，除了成本大幅上漲之外，並不會帶來更多的益處。

那麼多少是足夠呢？

舉個例子，上學的時候，有的人翻一遍書最後考試就能拿到高分，而有些人翻了無數遍書，最後考試還是不理想。大家都是一雙眼睛、一對耳朵，最終卻成績不同，本質上是因為聰明程度或學習方法不同導致的。也就是説如果足夠聰明，那麼不需要太多的信息輸入，也能拿到不錯的成績，即對於人來説，所謂的足夠，主要取決於聰明程度。

業界實現自動駕駛基本分為兩種方式：“強感知、強智能”和“弱感知、強智能”，後一種方式目前只有少數企業在採用，也就是以視覺方案為主的策略，代表是特斯拉；前一種則是絕大部分企業採用，擁有激光雷達、高精地圖等額外感知手段，提升“強感知”。

所謂的智能，即是聰明程度，拋開硬件的算力不談，各家廠商真正角逐的賽場，其實在學習方法的提高方面，換句話説，也就是軟件層面的問題。這其實就是為什麼現如今自動駕駛行業的發展，愈發偏向軟件研發公司，例如華為、達摩院等企業的入場。

自動駕駛，需要應對的道路情況極為複雜，因為除了固定的道路信息之外，每個人、車都具有極強的不確定性，可能發生的情況接近於“無限”。如果由程序員來界定車輛在何種情況下進行某種操作，那麼就是以“有限”對“無限”，根本沒有勝算。所以業界無一例外，在對信息的整合處理階段，都是採用人工智能的方式，對神經網絡進行訓練，通過深度學習的方式提高“智力”。

深度學習，是一種針對神經網絡的訓練方式。簡單理解，即是通過電子解構模擬了人類大腦的學習方式，通過大量“學習材料”對其進行訓練，即可使其獲得類似人類一樣認知世界和理解世界的能力。

並且當訓練到達一定級別時，就如同人類已經對周圍事物相當熟悉，此時你並不需要仔細觀察某物，或者需要多種信息交叉對比才能確定這玩意到底是啥，僅僅需要看一眼就能準確得知物體是什麼。自動駕駛領域對神經網絡的訓練，也能達到同樣的效果，一旦訓練程度足夠，那麼感知層面所需要的信息量就很少。

例如comma.ai在普通車型上，僅僅通過加裝一部普通手機作為感知和運算單元，加上自己寫的自動駕駛算法openpilot，就能較好實現L2.5級別自動駕駛。

創始人George Hotz是一位軟件天才、黑科，曾在2007年破解第一代iPhone，2009年破解iPhone 3GS，以及後來破解索尼PS3、PSN。曾在特斯拉AP團隊工作過，於2015年成立自己的人工智能公司comma.ai，專注於自動駕駛，利用神經網絡和機器學習研發了openpilot系統，通過手機作為感知傳感器和計算單元，實現L2.5級別自動駕駛。用户只需採購幾百刀的設備，即可將幾款指定車型變為L2.5級別自動駕駛車輛。

不過自動駕駛不同於考試，達到高分是不夠的，終極目標需要的是無限逼近滿分才行，畢竟汽車本質上是一台高速移動的“危險機器”，一個小錯誤都可能以生命為代價。

所以整個自動駕駛行業，從之前的硬件競爭，逐漸轉變為了機器學習競爭。也就是説，誰能更好更快地訓練自動駕駛AI，誰就具有真正的優勢和技術壁壘。達摩院發佈的自動駕駛仿真路測平台，就是為此服務的。

車輛所需的訓練數據，來源無外乎兩類：模擬器、實際道路。

一般來説，車輛在初期訓練階段都是在模擬器中進行的，優勢在於可以24小時不停地進行學習，從而大幅提升基礎自動駕駛能力。但問題在於，模擬器中雖説可以針對不同的道路環境進行自定義設置，但仍然比不上實際道路的複雜狀況，也就是在模擬器中訓練完成，猶如應試教育畢業的學生，與社會仍然存在脱節。

如果採用實際道路數據，效果會好很多，但是實際道路數據需要大量行駛在普通公開道路的車輛，而到達這個級別的車輛只有一個：特斯拉。

根據2月底舉行的Scaled Machine Learning Conference中，特斯拉AI和視覺負責人Andrej Karpathy分享了最新的數據，在AP啓用狀態下共行駛了30億英里，NOA啓用狀態下里程超過10億英里，自動變道執行超過20萬次，高級智能召喚使用次數超過120萬次。

特斯拉自家的大型計算機集羣項目Dojo可以將這些數據篩選整合，基於真實的路測信息對AP算法進行無監管訓練和優化升級。但這樣級別的規模和早於市場很多年的規劃，不是哪個自動駕駛企業都能做到的，無論是售出車輛規模還是軟件團隊進度。例如投入自動駕駛長達十幾年之久的谷歌團隊Waymo至今的路測里程不過2000萬英里而已。

多家研究機構表示，自動駕駛車輛需要積累177億公里的實際路測數據，才能保證自動駕駛的安全性。這樣就進入了死循環，自動駕駛的能力不夠，產品力就不足以有吸引力，那麼市場中行駛的自家車輛就少，而使用模擬器訓練又無法與實際路測訓練競爭。

所以達摩院發佈的自動駕駛仿真路測平台就派上用場了。

該平台能夠將現實的路況信息通過其他手段收集，並融合進模擬器環境中，也就是説神經網絡系統能夠得到比一般模擬器更加真實的訓練，能夠接近路測數據級別。該平台甚至通過算法模擬人類的不確定，對車輛進行隨機干預，模擬各種現實中奇怪的駕駛習慣以及場景。並且由於性能強勁，傳統極為複雜的場景需要僅1個月時間，而在達摩院這套平台中，僅需30秒即可完成複雜場景的構建和測試準備，每天可支持場景構建數量達百萬級別。整體訓練效率相比普通模擬器將提升百萬倍。

這無疑對於其他自動駕駛企業來説，是個天大的喜訊。

不過值得注意的是，這個平台就像一個高級培訓班，能夠獲得多少提升，還要看自己的算法優劣。因為本身深度學習本身並不複雜，一個略微懂Python的朋友也能夠自己玩，比如Chares 2.0系統就是國外一個博主自己針對GTA5遊戲，編寫的自動駕駛軟件，經過半年多的訓練優化，已經能夠在遊戲中實現相對不錯的效果。

但這東西就是入門簡單，精通難，想要提高效率、優化算法，是一件極其複雜的事情。這也是為什麼近幾年，有不只一家公司被特斯拉起訴，前員工將部分算法代碼“偷”到下家使用。

總結來説，自動駕駛發展道路上，硬件技術雖然重要，但只是門檻，真正的技術壁壘和難點，集中在自動駕駛神經網絡的訓練上。並且基於神經網絡的訓練模式，這種進步速度是超乎一般人想象的，最簡單的例子就是谷歌的Alpha Go僅用幾年時間，就擊敗了全球頂尖圍棋高手。

當然想要完全克服所有場景下適用的完全自動駕駛，還是需要大量工程師的長久努力，但如今自動駕駛的發展速度已經不能用日新月異來形容了，應該用每分每秒來計量。神經網絡系統無時不刻通過大量數據在“進化”，就相當於一個頂尖天才從不休息地在高效學習，其結果可想而知。

達摩院此次發佈的仿真路測平台或許很多人不在意，但是記住筆者的話，在不久的將來，或許你使用的自動駕駛系統就“畢業”於這裏。

點擊支持一下唄