車東西(公眾號:chedongxi)文 | 曉寒
車東西6月15日消息,國內自動駕駛芯片公司黑芝麻今天發佈了旗下第二款產品——華山二號芯片。
該芯片是黑芝麻創業四年來的最重磅產品,單芯片AI算力最高可達70TOPS(A1000)。由兩顆華山二號組成的域控制器,最高可實現140TOPS的AI算力,功耗25W,可支持L3級自動駕駛。
▲黑芝麻華山二號(A1000)芯片
作為對比,目前量產車中最強自動駕駛芯片——特斯拉FSD芯片單顆為72TOPS。兩顆特斯拉FSD芯片構成的域控制器(HW3.0),算力為144TOPS,功耗72W。
很明顯,黑芝麻華山二號實現了接近特斯拉FSD芯片的算力,但是能耗卻只是特斯拉差不多三分之一,同時成本也比特斯拉更低。
從數據上來看,華山二號毫無疑問是國內最強自動駕駛芯片,性能已逼近特斯拉FSD芯片,同時還擁有明顯的功耗和成本優勢。
那麼問題來了,作為一家創業公司,黑芝麻的華山二號芯片究竟是如何實現這種炸裂性能的?華山二號芯片的問世,又將給風起雲湧的自動駕駛市場帶來怎樣的改變呢?
帶着這些疑問,車東西也與硅谷芯片老炮——黑芝麻CEO單記章進行了長達兩個小時的對話,找到了問題的答案。
一、豪華芯片團隊推王牌產品 性能叫板特斯拉
今天晚上,芯片創企黑芝麻舉行線上發佈會,推出了旗下的第二款產品,也是創業四年來的最重磅產品——華山二號自動駕駛芯片,包括A1000和A1000 Lite兩個版本。
其中單顆A1000最高可實現70 TOPS的AI算力,功耗在8W以內。通過不同的組合,A1000可以支持從L0到L4的多種自動駕駛系統。
由單顆A1000組成的控制器,可以支持L2 級自動駕駛,2顆、4顆並聯,則分別可以實現140 TOPS和280 TOPS的算力,用來支持L3,甚至是限定場景的簡單的L4級自動駕駛系統。
▲基於A1000可組成不同的計算平台
目前量產車中最強的自動駕駛芯片為特斯拉的FSD芯片,單顆算力為72 TOPS,略高於A1000。兩顆FSD芯片組成了特斯拉3.0版的自動駕駛控制器(HW3.0),總算力144 TOPS,功耗為72W。
做個對比,兩顆黑芝麻A1000組成的L3級自動駕駛控制器算力為140 TOPS,功耗25W,能效比為5.6 TOPS/W。特斯拉FSD控制器為2 TOPS/W,英偉達Xavier單芯片則為1 TOPS/W(控制器功耗略大,能效比更低)。
這樣的數據表現,不僅讓A1000成了國內目前最強的自動駕駛芯片,並且還有實力叫板特斯拉FSD芯片。
那麼到底是怎樣一個團隊,打造出了參數這麼優秀的一個自動駕駛芯片呢?
答案是一支芯片老炮 車企老將組成的創業團隊。
▲左右分別為黑芝麻COO劉衞紅、CEO單記章
黑芝麻CEO單記章此前是全球視覺芯片領軍企業OmniVision創始團隊成員,在硅谷芯片行業打拼了20多年,在圖像處理芯片和軟件算法上具有豐富的經驗和技術積累。
CTO齊崢是英特爾奔騰二代芯片主要設計成員、CSO曾代兵是中興微電子總工程師,COO劉衞紅則曾是博世中國ADAS主力部門——底盤與控制系統事業部的中國區總裁。
正是這樣一支豪華創業團隊,也讓其在成立之初就迅速獲得了資本的青睞。
2017年,蔚來、芯動能等資方向其投資了近億元。2019年4月,黑芝麻又獲得了上汽、SK中國、招商局等機構的B輪投資。
▲黑芝麻美國辦公室
蔚來和上汽分別是國內最強的新造車和傳統車企,芯動能背後是國家集成電路產業投資基金和屏幕巨頭京東方,SK則是韓國電信巨頭。
黑芝麻的股東背景同樣豪華,尤其是蔚來和上汽的入局,也讓華山二號芯片的量產落地充滿了看點。
二、如何做到高算力?自研AI加速器和ISP是關鍵
自動駕駛系統非常依賴神經網絡,對芯片的AI算力要求極高。
各大芯片玩家們則紛紛推出了整合有CPU、GPU、ISP、DSP等多個處理器的SoC芯片來予以對應——黑芝麻的華山二號芯片就是一顆整合了20多個核心的SoC。
在SoC內部,不同芯片企業也選擇了不同的技術路徑。
比如英偉達Xavier內部使用了自家極強的GPU來增強AI算力,賽靈思的MPSoC內部則整合了自己擅長的FPGA,特斯拉FSD芯片則靠自研的NPU加速。
在單記章看來,GPU加速確實性能很強,但問題是GPU相比專用的AI加速器還是太通用了,它可以適配各類神經網絡是一個優勢,但問題是功耗大成本高。
FPGA的優點是硬件可編程,可以適配不同算法。但是對車企和Tier1的軟件工程師來説,還需要掌握硬件編程語言,用起來太複雜。
最終,黑芝麻選擇了跟特斯拉一樣的NPU路線,在SoC裏面集成了一個名為DynamAI NN引擎的NPU來進行AI加速。
這個NPU內部最多可搭載4個3D卷積MAC陣列、1個2D GEMM陣列,以及1個EDP運算單元和5個DSP,支持4/8/16位多種運算精度,工作頻率為1.2GHz。
這麼多的計算單元,既保證了大算力,同時又能夠適配不同的神經網絡,並進行壓縮和稀疏性加速,從而讓A1000最高可以實現70 TOPS的AI算力,以及超過80%的硬件利用率。
▲A1000芯片的AI加速引擎
自動駕駛系統對攝像頭的依賴極強,視頻畫面又是進行AI計算的基礎。對於一款自動駕駛芯片來説,能夠對圖像進行優質的前端處理至關重要。
這方面,基於單記章等核心成員在圖像處理芯片領域的積累,黑芝麻在A1000這顆SoC內還集成了自研的高性能ISP,以保證讓汽車看的更清。
單記章告訴車東西,得益於高性能ISP,A1000可以最多接入12路高清攝像頭的畫面,(最高甚至可以達到4K分辨率)。再加上高達30Gbps的高帶寬,讓其可以每秒處理12億像素。
此外,A1000還支持HDR處理,通過講長曝光和短曝光的圖像進行擬合,來讓汽車在黑暗、逆光等不利環境下也能看的清楚。
▲A1000支持HDR技術
一款自動駕駛芯片想要大規模量產,高算力只是第一步,適配性、安全性和經濟性也是重要指標。
單記章介紹稱,A1000不僅支持毫米波雷達、超聲波雷達、攝像頭、IMU、GPS等常見傳感器,並且還可接入高等級自動駕駛常用的激光雷達、V2X等數據。
該芯片從研發之初就嚴格遵循了車規標準,滿足AEC-Q100 G2、ISO26262 ASIL-B的要求。
在A1000內部,專門部署了一個安全核心,在其他核心失效時來保證基礎功能。同時在實現L3及以上級別自動駕駛時候,多顆A1000芯片互為冗餘,則可以達到ASIL D級認證。
經濟性上,A1000選擇了目前汽車芯片主流的16nm工藝,並通過巧妙的設計,將SoC封裝尺寸降低至90平方毫米。
作為對比,特斯拉採用的是三星14nm工藝,尺寸為260平方毫米。英特爾家Mobileye的最新產品EyeQ5則採用了7nm工藝。
較成熟的工藝以及較小的封裝面積,讓A1000擁有了不錯的成本優勢。再加上強大的AI算力、較低的功耗和廣泛的傳感器適配性,讓這款芯片真正具備了大規模前裝量產的潛力。
三、自動駕駛產業迎來中國芯 將加速L2/L3量產
從谷歌2009年成立自動駕駛團隊開始計算,自動駕駛產業已經走過了10個年頭。
雖然研發進程依然熱火朝天,但業界目前對L4級以上高等級自動駕駛系統的量產落地則較為悲觀——L4級無人車仍然需要安全員隨時監督,自動駕駛系統僅能在簡單環境行駛,真正規模化部署遙遙無期。
不過好消息是L1/L2級自動駕駛已經迎來爆發期——甚至成了新車標配功能。而L3級自動駕駛,也到了量產前夜。
博世底盤控制系統中國區駕駛員輔助業務單元副總裁蔣京芳此前表示,僅2019年,就至少有40款新車搭載了博世的L2級自動駕駛,呈現出井噴的態勢。
▲A1000開發板
到了2020年,廣汽、長安等自主車企又加速了L3級自動駕駛技術的量產進程,先後進行了L3級自動駕駛技術的演示,併發布了支持L3級自動駕駛系統的量產車型。
L1~L3級自動駕駛技術火熱的同時,卻也存在着明顯的缺芯現象。
對於L0/L1級系統,使用傳統的車規級CPU/MCU即可滿足需求,但到了L2以及L2 、L3級別,就需要引入越來越多的AI算法,也意味着需要AI加速器的支持。
目前使用較多的是FPGA和GPU加速,但是都不是最合適的產品。
“有Tier1就向我們反饋,現在使用的FPGA芯片雖然算力足,但是硬件編程複雜性太高,用起來並不順手。”單記章這樣向車東西説道,“GPU算力也強,但功耗和價格又太高了,不適合大規模量產。”
單記章説的不無道理。
特斯拉的車型早期就選用了英偉達的計算平台,但隨後又果斷下決心自研了FSD芯片,降低了對GPU的依賴。
奧迪是全球首個發佈L3級自動駕駛量產車(現款A8)的玩家,但因為沒有現成的芯片可用,無奈只能用Mobileye EyeQ3、英偉達K1、Altera Cyclone等多款芯片並聯起來,自己做了一個名為zFAS的域控制器。
▲奧迪zFAS架構
“多個芯片一起使用的協同難度肯定比單個SoC芯片高的多,總結一下就是效率低功耗還高。”單記章這樣説道。
面對這一現狀,技術實力極強的特斯拉選擇自研芯片來解決,但其他車企則只能等待供應商推出更適合汽車的自動駕駛芯片。
這次發佈的高算力、低功耗和低成本的華山二號,就是為了解決了這一問題而推出。
單記章告訴車東西,華山二號已經送至多個車企展開測試。
“爭取今年能有多個落地突破。”單記章説道,“多個車企對我們的芯片都很有興趣。”
事實上,就在今晚的線上發佈會上,中國一汽黨委常委、副總經理王國強,博世中國總裁陳玉東、蔚來汽車創始人李斌、上汽集團副總裁兼總工程師祖似傑等汽車行業大佬也都錄製了視頻對黑芝麻表示支持。
王國強在發佈會上表示:“黑芝麻已經與中國一汽在智能駕駛超算平台、軟硬件開發、人工智能視覺感知算法等方面展開全方位合作,在不遠的將來必將結出豐碩的成果。希望黑芝麻能夠打造出中國領先、世界一流、滿足用户需求的智能駕駛核心算法和芯片。”
很明顯,華山二號的推出,將為汽車行業提供了一個更加合適的自動駕駛芯片,從而促進更多新的自動駕駛功能逐步落地。
最後,自動駕駛技術作為各個國家激烈競爭的未來技術高地,極具戰略意義。我國政府在《智能汽車創新發展戰略》等文件中指出,要加快推動車載高性能芯片技術的發展,實現自主可控。
黑芝麻華山二號的發佈,就為增強我國自動駕駛產業的整體實力,實現自主可控做出了貢獻。