楠木軒

華為的激光雷達和特斯拉的視覺算法,誰才是自動駕駛的未來?

由 諸葛寒香 發佈於 科技

編者按:本文來自微信公眾號“騰訊科技”(ID:qqtech),作者:張抗抗,36氪經授權發佈。

清華大學動力工程與工程熱物理博士 張抗抗

近期,華為在上海車展展示了一項接近L4級別的無人駕駛技術,引發了一連串的技術討論。

華為的這套方案,是通過自研的激光雷達算法實現了接近L4級別的自動駕駛,同時華為也宣稱要將96線激光雷達的成本降低到200美金以內。

從目前的情況看,以特斯拉、百度Apollo為代表的視覺算法派堅持認為激光雷達是成本高,技術發展慢的產物,並不如視覺算法的價值高。但華為、小鵬這樣的公司則認為,激光雷達是比視覺算法更好的技術。

哪一種方案最靠譜?目前激光雷達發展到了一個怎樣的水平?希望這篇文章能給你答案。

激光雷達在全視角覆蓋和定位中的應用展示(圖片源於WAYMO)

“激光雷達”派和“視覺算法”派先進性的爭論,由來已久

激光雷達是和視覺算法誰才是智能駕駛的未來,這個爭論由來已久。作為電動車領域“喬布斯式”的人物,馬斯克曾在2019年拋出“只有傻瓜才會用激光雷達”的驚天言論,他可能是發動激光雷達和視覺算法口水戰的始作俑者。

但在我們展開討論這個問題之前,首先要明確關鍵的一點是:我們這裏討論的激光雷達,並非獨立存在的,它是由激光雷達所組成的一整套車輛周邊數據採集系統,採用激光雷達的方案並不意味着拋棄視覺算法,而是在原視覺算法方案的基礎上增加了激光雷達的應用。

例如“視覺派”特斯拉的感知系統是由1個毫米波雷達、12個超聲波雷達和8個攝像頭組成。而在已公佈的“激光雷達派”量產車型中,極狐αS的感知系統由3顆激光雷達、6顆毫米波雷達、12顆超聲波雷達、13顆攝像頭以及高精地圖組成,小鵬P5的感知系統則是由2個激光雷達,12個超聲波傳感器、5個毫米波雷達、13個高感知攝像頭和高精地圖組成。

由此可見,“激光雷達派”不僅增加了全新的激光雷達傳感器和高精地圖,而且在傳統的視覺傳感器上,數量也比“視覺派”車型多。

因此,“激光雷達”派和“視覺算法”派誰才是自動駕駛的未來這個問題,更嚴謹的問法應該是:僅依靠視覺算法的方案,與以激光雷達和視覺多傳感器融合的方案,各自的優勢與劣勢是什麼?

從現有的情況我們會發現,僅僅依靠視覺算法的方案的優勢是成本較低,但它對於算法的要求非常高,而當前的算法水平遠達不到人類要求的水平。

而以激光雷達和視覺多傳感器融合的方案,其優勢是可以更好地處理corner case(邊界情況),但它對算力的要求很高,而且硬件成本也並不低。

其實視覺算法的識別準確率已經很高了,只是它對極低概率的corner case 的能力實在有限。這是正常的情況,即便是人類依靠雙眼,有時候也會因為眼睛的可視範圍、眼花等問題導致交通事故的產生。

而在原視覺系統中增加激光雷達,則可以大大減少這類corner case的概率。即便是有一天視覺算法的水平達到了人類駕駛員的水平,增加激光雷達依然可以進一步降低事故概率,要考慮的僅僅只是成本收益問題 —— 如果激光雷達足夠便宜,就相當於支出一份保險費來降低事故率。

在未來,激光雷達和視覺算法之間的市場競爭依舊會存在,同時成本收益問題仍舊是需要考慮的一個重要方面。不同應用場景下對感知系統的要求不同,技術的選擇也會有差別。

例如基本的L2輔助駕駛功能和2020年較為高階的高速領航駕駛功能(特斯拉NOA、蔚來NOP、小鵬NGP),僅依靠毫米波雷達及視覺就可以完好地運行,而在2022年大家重點關注的城市領航駕駛功能設計中,激光雷達就成了必備品。

以未來3-5年的時間點來看,激光雷達成本將會大幅降低,但依然會有一定的成本,這意味着同一個車型可以選擇不同等級的自動輔助駕駛系統,車型的價格也不同,消費者可以根據自己的需求選裝激光雷達。

換而言之,從目前我們定義的最先進的自動輔助駕駛技術來看,未來幾年帶有激光雷達的方案會成為主流,但從裝載車型的絕對數量上來看,帶激光雷達的方案還是一個相對小眾的選擇。

對於在技術上已經相對成熟的視覺算法,激光雷達當下的技術水平究竟如何?

特斯拉在目前電動汽車市場上的成功,從一個側面反映了在當下的市場、政策和用户需求的前提下,視覺算法已經是一套相當成熟的解決方案。通過攝像頭和毫米波/超聲波雷達的配合,特斯拉可以實現L2級別的ADAS(高級自動輔助駕駛)功能。但是因為受限於芯片算力、邏輯算法等因素,視覺算法實際上很難再進一步。

而對於激光雷達來説,它還屬於“半上車”的狀態,之所以技術發展的如此緩慢,這與激光雷達本身存在的歷史問題不無關係。如果要理清這個問題,我們先要從ADAS技術領域入手,在充分考慮其應用場景與成本的背景下做出評判。

WAYMO自動駕駛汽車當時所搭載的機械式激光雷達(圖片源於WAYMO)

早期無人駕駛開發的車型多采用的是機械旋轉式激光雷達,可以對周圍環境進行360°的水平視場掃描,而半固態與固態激光雷達往往只能做到最高120°的水平視場掃描。

從絕對指標來看,360°肯定要優於120°,但這並不能説明機械旋轉式激光雷達的技術水平更高,因為考慮到成本、安裝位置、可靠性與壽命等因素,將機械旋轉式激光雷達應用到量產車上的難度,會遠大於固態與半固態激光雷達。

因此,從ADAS技術領域來關注激光雷達的技術水平,一個更好的角度是觀察那些實裝到量產車上的產品,例如採用華為激光雷達方案的極狐αS與採用大疆Livox方案的小鵬P5。

左:採用華為激光雷達方案的極狐αS 右:採用大疆Livox方案的小鵬P5(圖片源於官網)

可以肯定的是,未來幾年是激光雷達的快速提升性能、降低成本的幾年。

從ADAS技術領域來評價激光雷達,不僅要關注其絕對性能的指標,更應該結合應用場景、感知系統的角度來評價,這樣才會更具現實意義。

從這個意義來説,像華為、大疆這種既做全套解決方案,又做激光雷達零部件的廠家,能更好地發揮有限性能激光雷達的潛力,在未來的行業中有更具優勢。

除此之外,關於當前的ADAS技術領域,上述提及的激光雷達和攝像頭其實都屬於感知系統的一部分,而感知系統通常還包括了毫米波雷達、超聲波雷達、高精定位系統與高精地圖。

一套完整的ADAS除了感知系統之外,還應該包括決策系統與執行系統。要理解這些系統,我們可以回想一下平時咱們是怎麼開車的:

第一是眼睛的環境感知方面:車道的位置,前方是否有車輛行駛,紅燈和綠燈的交換,這些工作都是由超廣角、快速對焦、無級調光圈、雙目即時測距、損傷自修復的超高性能仿生攝像頭——眼睛來完成的。

更為重要的是,此仿生攝像頭自帶極強的人工智能處理器,自動完成圖像處理(例如剔除毛細血管的遮擋、插幀補全盲點像素等)、對象識別(例如紅綠燈、車道)、軌跡預測(前方的車輛即將轉彎)等功能之後,將信息上報給“上層意識”。

另外是大腦的行為決策:通過環境感知的信息來判斷車輛需要執行的控制策略,例如前方車輛停止,需要緊急剎車等。還要提到的是,像“今天走不走高速”的路徑規劃也屬於廣義的決策功能。

還有事手腳的控制執行:在收到大腦的決策指令後,駕駛員的神經、四肢,以油門剎車與方向盤作為人車交互的兩大媒介,與整個汽車系統一起承擔車輛控制的功能。所以目前來看,AD AS系統中最難、最關鍵的還是感知系統。

成本控制,視覺算法和激光雷達最大的分水嶺

極光雷達上車難,難在成本控制。按照公開資料顯示,特斯拉目前所運用在其車型上的單目攝像頭成本在150~600元之間,更復雜的三目攝像頭成本也不過千元以內。

覽沃科技在CES2020上發佈的激光雷達產品(圖片源於覽沃科技官網)

激光雷達的價格,在最近5年也呈現一個明顯的下降趨勢,但是相比攝像頭來説,依然貴得多。去年8月,大疆旗下的覽沃科技發佈了在年初CES2020上帶來的激光雷達新品的行貨版本,其中Livox Horizon激光雷達,定價6499元,另一款長量程的Livox泰覽 Tele-15,價格則是8999 元。而這輛產品,在全球市場的定價分別是999美元和1499美元。

激光雷達的成本價格高,成為了阻礙其“上車”的原罪。

2020年,華為研製出了屬於自己的96線激光雷達,其宣稱要在未來將成本降低至200美金以內,這也是華為尚未實現的一個目標,而制定這個目標的依據主要是以下5點:

(1) 量產導致成本的降低

(2) 技術的進步促使了成本降低

(3) 針對應用場景開發特定性能的產品以降低成本

(4) 提供更好的系統開發環境以降低主機廠的研發成本,相當於變相降低了激光雷達成本

(5) 華為提供整套方案,激光雷達讓出的利潤可以在整套方案中掙回來,其實也相當於降低了成本

雖然目前的成本問題並未得到有效解決,但如今已經有先行者開始將激光雷達正式應用到上市的汽車上。

目前明確表示已搭載激光雷達的、即將上市的車有3款:蔚來ET7、小鵬P5 、極狐αS。這些車在交付的時候,只能説是“硬件支持L3、L4級自動駕駛”,但並不能“立刻實現L3、L4級自動駕駛”。

這麼看來,在廠家能夠真正實現L3、L4級自動駕駛之前,車上的激光雷達是不是暫時用不上了呢?其實並非如此,因為激光雷達不僅對L3、L4有用,也能顯著提升L2輔助駕駛的功能體驗。

為什麼激光雷達會讓人更放心呢?

這要從它的原理講起:一條激光,穿過去的時候是直的,相當於數字掃點,理論上把所有周圍的點掃一遍之後,就能清楚地知道周圍環境是什麼樣。

激光雷達的掃描示意圖(圖片源於velodyne lidar)

與激光雷達不同,攝像頭的採集的是像素信息,其實就和人眼看到的範圍差不多。

而與人不同的是,人眼配備了超強的智能處理器(大腦),可以在毫不費力的情況下識別出環境中的車道、車輛、行人等,對車輛來説,像素信息只是無意義的海量數字,必須經過抽象、重構等複雜過程,依賴超強智能才能達到人類的識別效果。

也就是説,如果不配備激光雷達,要想通過智能算法彌補感知能力地缺陷,需要多付出10倍的努力。

再打個比方,咱們人類駕駛員在開車的時候,偶爾也就看花眼的時候,比如將近處的物體識別成了遠處的 —— 這就是大腦在處理像素信息的時候產生了視錯覺。但如果給每個像素點都標上距離信息(相當於配備了激光雷達),那就絕不可能產生這種視錯覺了。同時,除了上面提到的場景之外,激光雷達對於強光變換、彎道巡航、夜間行車、狹窄通行等場景下的L2功能體驗提升都會很有幫助。

因此在目前的技術環境下,激光雷達和視覺算法並不應該是相互對立的關係,也沒有激光雷達的解決方案一定比視覺算法解決方案更好這樣的説法。

激光雷達和視覺算法應該是相輔相成的關係,激光雷達可以大幅提升視覺算法的精度,降低視覺處理對於超高精度算法的依賴,但目前高成本制約了更多的激光雷達出現在整車上;而視覺算法在未來的自動駕駛領域依然是主流的核心技術之一,它的應用廣泛性暫時是激光雷達這樣的產品無法替代的。

對於激光雷達來説,儘管它在目前還有比較多的問題亟待解決,但很顯然行業內已經有了共識,在未來的幾年內,L3-5的自動駕駛系統中,激光雷達將成為必不可少的組成部分。

相對於計算機視覺技術,激光雷達技術優點是安全性上會更高。這也是行業主動推動激光雷達在更高級別的自動駕駛中,成為主流的主要動力。