楠木軒

國內首款7nm通用GPU來了!240億晶體管,即將商用

由 度方針 發佈於 科技

芯東西(ID:aichip001)

編譯 | 心緣

編輯 | 漠影

芯東西3月31日報道,剛剛,國內首款自主可控的7nm雲端通用GPU在上海正式發佈。

該芯片為上海初創公司天數智芯研發的旗艦7nm GPGPU雲端訓練芯片BI,其加速卡也一併以實體形式發佈,即將進入批量生產和商用交付。

天數智芯成立於2015年,於2018年正式啓動BI的研發設計,該芯片在2020年5月流片、11月回片、12月成功“點亮”。

據悉,BI芯片能以競品50%的芯片面積、更低的功耗,提供主流廠商產品近2倍的峯值性能。

中國工程院院士倪光南,十二屆全國人大外事委員會副主任委員、中國社科院“一帶一路”國際智庫專家委員會主席、藍迪國際智庫專家委員會主席趙白鴿博士,也在會上特別分享了關於科技自立自強的洞察。

一、240億晶體管,峯值算力達147TFLOPS

天數智芯高級副總裁、首席科學家、聯合創始人鄭金山現場介紹了雲端訓練芯片BI及產品卡,BI芯片具備高性能、通用性、靈活性。

作為天數智芯首款旗艦產品,BI採用台積電7nm FinFET工藝、2.5D CoWoS封裝,基於全自研GPGPU架構,容納240億個晶體管,與主流GPGPU生態兼容,支持主流深度學習框架。

天數智芯BI產品參數

具體來看,該芯片內建FP32、FP16/BF16、INT32/16/8等多精度數據混合訓練,FP16精度下其單芯峯值算力達147TFLOPS

目前,BI產品實測數據基本符合設計規劃。

天數智芯全自研GPGPU架構基於SIMT架構的可伸縮分層計算引擎,自主定義的豐富指令集支持標量、向量和張量操作,並支持GPU通用並行編程模型,能有效對接現有軟件生態,易於擴展支持新的算法和應用領域,便於用户輕鬆遷移。

天數智芯BI架構

BI芯片還提供1.2TB/s HBM2內存帶寬、32GB存儲容量,片間互連帶寬達64GB/s@16x PCIe4,支持虛擬化方式。

其基於開放計算項目組(OCP)的標準加速模塊組(OAM)支持單卡最大300W-450W的系統解決方案,配合OAM服務器,進一步提升數據處理整體性能。

天數智芯BI OAM產品卡

為了方便開發者使用,天數智芯還打造了兼容主流深度學習框架的軟件棧,可幫助用户實現無痛遷移。

同時,天數智芯軟件棧結合硬件性能對HPC和區塊鏈等應用提供細粒度的優化和更大的算力支持,包括能對接各種互聯網應用平台的資源管理和監控插件、深度學習加速庫、兼容多種語言的編譯器、調優工具等。

天數智芯軟件棧

在量產後,天數智芯BI芯片及產品卡能為AI訓練及推理、認知型AI、高性能數據分析、基因組研究、金融預測分析等高負載工作提供算力支持,服務於教育、互聯網、金融、自動駕駛、醫療、安防等各相關行業。

二、倪光南:網信領域“中國體系”不斷髮展壯大,但痛點依然存在

在致辭期間,天數智芯董事長蔡全根説道:“天數智芯的長遠目標是,踏踏實實的在國產自主高端算力芯片上迭代攀登並最終比肩國際領先廠商。”

這個目標不易實現,但我們不會尋求模仿式的捷徑和投機式的彎道超車。”蔡全根説。

天數智芯董事長蔡全根發表致辭演講

中國工程院院士倪光南亦在現場發表演講。

他提到十八大以來,我國的信息產業實現了跨越式發展,目前在網信領域一些自主可控的核心技術已達到可用,並向好用、易用的方向發展,逐漸強大的網信領域的“中國體系”不斷髮展壯大。

但短板和痛點仍然存在,比如CPU、GPU這兩種信息系統中最複雜的電路芯片,越來越成為整個產業鏈上必須突破的短板。

有利的是,我們已經在短板上逐漸積累了越來越豐富的人才和技術,我們可以利用自己的制度優勢,集中力量辦大事,充分利用“新基建”機遇,迅速取長補短。

中國工程院倪光南院士發表演講

“天數智芯的BI芯片,一直堅持自主可控和開放創新並重,目前已擁有自己的技術體系和生態,性能也很好,得到了政府、眾多投資者和合作夥伴的大力支持。”

倪光南院士説,他期待天數智芯在行業逐步建立自己的標準,逐步發展壯大,可以和國際級企業同台競爭,為建設科技自立自強的科技強國做出貢獻。

三、趙白鴿:必須保持自主研發和開放的平衡

趙白鴿博士是十二屆全國人大外事委員會副主任委員、中國社科院“一帶一路”國際智庫專家委員會主席、藍迪國際智庫專家委員會主席。

她提到很早就開始關注天數智芯,這也是藍迪國際智庫平台重點培育、推介的企業。

在她看來,天數智芯BI的成功研發並推出實體產品,為我國自主高端主流通用芯片的開發應用,打開了一條突破口,也為國內算力密集行業的發展、人工智能的落地,提供了更多、更好的選擇,也更多了一層安全保障。

趙白鴿博士發表致辭演講

趙白鴿博士説,經過非常深入研究,他們發現必須做到知己知彼百戰不殆,一定要競爭合作,美國在科技創新方面有非常好的基礎,但中國在市場應用方面,沒有其他地區可以比得過,我們必須尋找自身發展之路,同時認清新的發展機會。

要繼續發展,怎麼做?趙白鴿博士認為,有些問題應該是政府解決,有些問題應該是企業。

首先是國際形勢帶來的影響,我們必須認清我們是誰、我們往哪裏走,以及他們是誰、他們往哪裏走。我們必須保持自主研發和開放之間的平衡,以利於真正能獲得世界領域的突破,把中國知識經濟產業推動上去。

同時趙白鴿博士提到,中國在底層技術方面(與美國)還有很大差距,美國籠絡了全世界的人才,並有一定糾錯能力,發現問題後會很快調整,紮實發展底層技術與戰略、人才緊密聯繫。

另外,政企間的溝通合作非常重要,管理創新非常值得研究,政績不僅是GDP含量,還包括和知識經濟緊密聯繫的GDP質量,包括對人才的支持和保護,我們必須以更開放的胸懷向全世界招攬人才。

同時,我們也要注重知識產權保護,並將企業發展和國家大戰略很好地結合。趙白鴿博士希望,天數智芯此次發佈,也能引發對資源組合上的新思想和考慮。

天數智芯聯合浪潮打造OAM AI服務器

四、過去一年,GPGPU創企成“吸金猛獸”

就在本月初,天數智芯宣佈完成12億元C輪融資,計劃將資金用於進一步加速面向5G技術需求的雲端訓練及推理芯片的市場化、商業化和規模化。

除了天數智芯外,國內多家聚焦雲端芯片賽道的GPGPU創企在過去一年公佈高額融資。

為什麼本土GPGPU創企開始在資本市場吃香?

這是時代使然。隨着人工智能技術從高校走向產業,擅長通用並行計算的GPGPU需求猛增,國際GPU巨頭NVIDIA一手掌握絕大部分雲端AI訓練芯片市場,幾乎全球沒有能與之抗衡的對手。

這一方面致使產業下游缺乏議價能力,另一方面也導致安全隱憂,在國際貿易紛爭不休的背景下,芯片半導體產業關鍵環節的自主可控已迫在眉睫,多國均在謀劃核心技術及供應鏈本土化。

而國內市場容量和需求量持續上漲的GPGPU,無疑是必然要力爭自主可控的技術高地。

新基建大潮下,人工智能、雲數據中心、城際交通、新能源汽車等行業的發展,以及5G應用的普及,正不斷催化國內雲端AI算力的需求。

但之所以GPGPU市場長期被NVIDIA把控,主要原因在於其技術門檻高和生態佈局完善,經歷過先進製程研發和量產完整流程的人才非常稀缺。

這是一個贏家通吃的領域,掌握充沛人才和市場資源的NVIDIA,通過CUDA不斷積累和吸引開發者,從而構成愈發堅不可摧的生態壁壘。

因此,選擇GPGPU賽道的多數創企,在邁出第一步時都相當謹慎,雖然以NVIDIA為目標,但主要先聚焦在悠哈某一特定方向的性能,打出差異化優勢,然後再逐步擴展產品邊界。

同時,考慮到絕大多數開發者都習慣使用NVIDIA CUDA,這些企業一方面着力研發方便好用的自家軟件工具鏈,另一方面也基本都兼容主流GPGPU生態。

結語:國內GPGPU商用前路仍充滿挑戰

如今國內GPGPU玩家正羣雄四起,包括天數智芯在內的多家創企,均在融資及產品商用落地方面持續發力。隨着更多玩家的芯片從研發走向落地,國內GPGPU創企將從資本、人才的競爭,逐漸過渡到產品比拼和市場爭奪的新較量環節。

本土自研芯片的道路往往艱辛而充滿風險。對於這些初創團隊來説,除了研發出能令客户滿意的芯片產品外,如何在巨頭主導的市場中找到生存空間、如何構建起自己的生態……都是在未來商用化道路上需要克服的挑戰。