最強國產自動駕駛晶片出爐!兩顆就能玩轉L3級自動駕駛
車東西(公眾號:chedongxi)文 | 曉寒
車東西6月15日訊息,國內自動駕駛晶片公司黑芝麻今天釋出了旗下第二款產品——華山二號晶片。
該晶片是黑芝麻創業四年來的最重磅產品,單晶片AI算力最高可達70TOPS(A1000)。由兩顆華山二號組成的域控制器,最高可實現140TOPS的AI算力,功耗25W,可支援L3級自動駕駛。
▲黑芝麻華山二號(A1000)晶片
作為對比,目前量產車中最強自動駕駛晶片——特斯拉FSD晶片單顆為72TOPS。兩顆特斯拉FSD晶片構成的域控制器(HW3.0),算力為144TOPS,功耗72W。
很明顯,黑芝麻華山二號實現了接近特斯拉FSD晶片的算力,但是能耗卻只是特斯拉差不多三分之一,同時成本也位元斯拉更低。
從資料上來看,華山二號毫無疑問是國內最強自動駕駛晶片,效能已逼近特斯拉FSD晶片,同時還擁有明顯的功耗和成本優勢。
那麼問題來了,作為一家創業公司,黑芝麻的華山二號晶片究竟是如何實現這種炸裂效能的?華山二號晶片的問世,又將給風起雲湧的自動駕駛市場帶來怎樣的改變呢?
帶著這些疑問,車東西也與矽谷晶片老炮——黑芝麻CEO單記章進行了長達兩個小時的對話,找到了問題的答案。
一、豪華晶片團隊推王牌產品 效能叫板特斯拉
今天晚上,晶片創企黑芝麻舉行線上釋出會,推出了旗下的第二款產品,也是創業四年來的最重磅產品——華山二號自動駕駛晶片,包括A1000和A1000 Lite兩個版本。
其中單顆A1000最高可實現70 TOPS的AI算力,功耗在8W以內。透過不同的組合,A1000可以支援從L0到L4的多種自動駕駛系統。
由單顆A1000組成的控制器,可以支援L2 級自動駕駛,2顆、4顆並聯,則分別可以實現140 TOPS和280 TOPS的算力,用來支援L3,甚至是限定場景的簡單的L4級自動駕駛系統。
▲基於A1000可組成不同的計算平臺
目前量產車中最強的自動駕駛晶片為特斯拉的FSD晶片,單顆算力為72 TOPS,略高於A1000。兩顆FSD晶片組成了特斯拉3.0版的自動駕駛控制器(HW3.0),總算力144 TOPS,功耗為72W。
做個對比,兩顆黑芝麻A1000組成的L3級自動駕駛控制器算力為140 TOPS,功耗25W,能效比為5.6 TOPS/W。特斯拉FSD控制器為2 TOPS/W,英偉達Xavier單晶片則為1 TOPS/W(控制器功耗略大,能效比更低)。
這樣的資料表現,不僅讓A1000成了國內目前最強的自動駕駛晶片,並且還有實力叫板特斯拉FSD晶片。
那麼到底是怎樣一個團隊,打造出了引數這麼優秀的一個自動駕駛晶片呢?
答案是一支晶片老炮 車企老將組成的創業團隊。
▲左右分別為黑芝麻COO劉衛紅、CEO單記章
黑芝麻CEO單記章此前是全球視覺晶片領軍企業OmniVision創始團隊成員,在矽谷晶片行業打拼了20多年,在影象處理晶片和軟體演算法上具有豐富的經驗和技術積累。
CTO齊崢是英特爾奔騰二代晶片主要設計成員、CSO曾代兵是中興微電子總工程師,COO劉衛紅則曾是博世中國ADAS主力部門——底盤與控制系統事業部的中國區總裁。
正是這樣一支豪華創業團隊,也讓其在成立之初就迅速獲得了資本的青睞。
2017年,蔚來、芯動能等資方向其投資了近億元。2019年4月,黑芝麻又獲得了上汽、SK中國、招商局等機構的B輪投資。
▲黑芝麻美國辦公室
蔚來和上汽分別是國內最強的新造車和傳統車企,芯動能背後是國家積體電路產業投資基金和螢幕巨頭京東方,SK則是韓國電信巨頭。
黑芝麻的股東背景同樣豪華,尤其是蔚來和上汽的入局,也讓華山二號晶片的量產落地充滿了看點。
二、如何做到高算力?自研AI加速器和ISP是關鍵
自動駕駛系統非常依賴神經網路,對晶片的AI算力要求極高。
各大晶片玩家們則紛紛推出了整合有CPU、GPU、ISP、DSP等多個處理器的SoC晶片來予以對應——黑芝麻的華山二號晶片就是一顆整合了20多個核心的SoC。
在SoC內部,不同晶片企業也選擇了不同的技術路徑。
比如英偉達Xavier內部使用了自家極強的GPU來增強AI算力,賽靈思的MPSoC內部則整合了自己擅長的FPGA,特斯拉FSD晶片則靠自研的NPU加速。
在單記章看來,GPU加速確實性能很強,但問題是GPU相比專用的AI加速器還是太通用了,它可以適配各類神經網路是一個優勢,但問題是功耗大成本高。
FPGA的優點是硬體可程式設計,可以適配不同演算法。但是對車企和Tier1的軟體工程師來說,還需要掌握硬體程式語言,用起來太複雜。
最終,黑芝麻選擇了跟特斯拉一樣的NPU路線,在SoC裡面集成了一個名為DynamAI NN引擎的NPU來進行AI加速。
這個NPU內部最多可搭載4個3D卷積MAC陣列、1個2D GEMM陣列,以及1個EDP運算單元和5個DSP,支援4/8/16位多種運算精度,工作頻率為1.2GHz。
這麼多的計算單元,既保證了大算力,同時又能夠適配不同的神經網路,並進行壓縮和稀疏性加速,從而讓A1000最高可以實現70 TOPS的AI算力,以及超過80%的硬體利用率。
▲A1000晶片的AI加速引擎
自動駕駛系統對攝像頭的依賴極強,影片畫面又是進行AI計算的基礎。對於一款自動駕駛晶片來說,能夠對影象進行優質的前端處理至關重要。
這方面,基於單記章等核心成員在影象處理晶片領域的積累,黑芝麻在A1000這顆SoC內還集成了自研的高效能ISP,以保證讓汽車看的更清。
單記章告訴車東西,得益於高效能ISP,A1000可以最多接入12路高畫質攝像頭的畫面,(最高甚至可以達到4K解析度)。再加上高達30Gbps的高頻寬,讓其可以每秒處理12億畫素。
此外,A1000還支援HDR處理,透過講長曝光和短曝光的影象進行擬合,來讓汽車在黑暗、逆光等不利環境下也能看的清楚。
▲A1000支援HDR技術
一款自動駕駛晶片想要大規模量產,高算力只是第一步,適配性、安全性和經濟性也是重要指標。
單記章介紹稱,A1000不僅支援毫米波雷達、超聲波雷達、攝像頭、IMU、GPS等常見感測器,並且還可接入高等級自動駕駛常用的鐳射雷達、V2X等資料。
該晶片從研發之初就嚴格遵循了車規標準,滿足AEC-Q100 G2、ISO26262 ASIL-B的要求。
在A1000內部,專門部署了一個安全核心,在其他核心失效時來保證基礎功能。同時在實現L3及以上級別自動駕駛時候,多顆A1000晶片互為冗餘,則可以達到ASIL D級認證。
經濟性上,A1000選擇了目前汽車晶片主流的16nm工藝,並透過巧妙的設計,將SoC封裝尺寸降低至90平方毫米。
作為對比,特斯拉採用的是三星14nm工藝,尺寸為260平方毫米。英特爾家Mobileye的最新產品EyeQ5則採用了7nm工藝。
較成熟的工藝以及較小的封裝面積,讓A1000擁有了不錯的成本優勢。再加上強大的AI算力、較低的功耗和廣泛的感測器適配性,讓這款晶片真正具備了大規模前裝量產的潛力。
三、自動駕駛產業迎來中國芯 將加速L2/L3量產
從谷歌2009年成立自動駕駛團隊開始計算,自動駕駛產業已經走過了10個年頭。
雖然研發程序依然熱火朝天,但業界目前對L4級以上高等級自動駕駛系統的量產落地則較為悲觀——L4級無人車仍然需要安全員隨時監督,自動駕駛系統僅能在簡單環境行駛,真正規模化部署遙遙無期。
不過好訊息是L1/L2級自動駕駛已經迎來爆發期——甚至成了新車標配功能。而L3級自動駕駛,也到了量產前夜。
博世底盤控制系統中國區駕駛員輔助業務單元副總裁蔣京芳此前表示,僅2019年,就至少有40款新車搭載了博世的L2級自動駕駛,呈現出井噴的態勢。
▲A1000開發板
到了2020年,廣汽、長安等自主車企又加速了L3級自動駕駛技術的量產程序,先後進行了L3級自動駕駛技術的演示,併發布了支援L3級自動駕駛系統的量產車型。
L1~L3級自動駕駛技術火熱的同時,卻也存在著明顯的缺芯現象。
對於L0/L1級系統,使用傳統的車規級CPU/MCU即可滿足需求,但到了L2以及L2 、L3級別,就需要引入越來越多的AI演算法,也意味著需要AI加速器的支援。
目前使用較多的是FPGA和GPU加速,但是都不是最合適的產品。
“有Tier1就向我們反饋,現在使用的FPGA晶片雖然算力足,但是硬體程式設計複雜性太高,用起來並不順手。”單記章這樣向車東西說道,“GPU算力也強,但功耗和價格又太高了,不適合大規模量產。”
單記章說的不無道理。
特斯拉的車型早期就選用了英偉達的計算平臺,但隨後又果斷下決心自研了FSD晶片,降低了對GPU的依賴。
奧迪是全球首個釋出L3級自動駕駛量產車(現款A8)的玩家,但因為沒有現成的晶片可用,無奈只能用Mobileye EyeQ3、英偉達K1、Altera Cyclone等多款晶片並聯起來,自己做了一個名為zFAS的域控制器。
▲奧迪zFAS架構
“多個晶片一起使用的協同難度肯定比單個SoC晶片高的多,總結一下就是效率低功耗還高。”單記章這樣說道。
面對這一現狀,技術實力極強的特斯拉選擇自研晶片來解決,但其他車企則只能等待供應商推出更適合汽車的自動駕駛晶片。
這次釋出的高算力、低功耗和低成本的華山二號,就是為了解決了這一問題而推出。
單記章告訴車東西,華山二號已經送至多個車企展開測試。
“爭取今年能有多個落地突破。”單記章說道,“多個車企對我們的晶片都很有興趣。”
事實上,就在今晚的線上釋出會上,中國一汽黨委常委、副總經理王國強,博世中國總裁陳玉東、蔚來汽車創始人李斌、上汽集團副總裁兼總工程師祖似傑等汽車行業大佬也都錄製了影片對黑芝麻表示支援。
王國強在釋出會上表示:“黑芝麻已經與中國一汽在智慧駕駛超算平臺、軟硬體開發、人工智慧視覺感知演算法等方面展開全方位合作,在不遠的將來必將結出豐碩的成果。希望黑芝麻能夠打造出中國領先、世界一流、滿足使用者需求的智慧駕駛核心演算法和晶片。”
很明顯,華山二號的推出,將為汽車行業提供了一個更加合適的自動駕駛晶片,從而促進更多新的自動駕駛功能逐步落地。
最後,自動駕駛技術作為各個國家激烈競爭的未來技術高地,極具戰略意義。我國政府在《智慧汽車創新發展戰略》等檔案中指出,要加快推動車載高效能晶片技術的發展,實現自主可控。
黑芝麻華山二號的釋出,就為增強我國自動駕駛產業的整體實力,實現自主可控做出了貢獻。