芯東西(公眾號:aichip001)
作者 | 溫淑
編輯 | 心緣
芯東西4月14日訊息,美國明星AI晶片獨角獸SambaNova Systems最新宣佈D輪融資6.76億美元(摺合44億人民幣),由軟銀願景基金2領投,英特爾資本、谷歌風投、華登國際等參投。
至此,該公司估值超過50億美元(摺合327億人民幣),成為全球估值最高的人工智慧(AI)創企之一。
這家脫胎於斯坦福大學的AI晶片創企,長期受到知名投資者的青睞,英特爾資本、谷歌風投、華登國際、貝萊德、紅鏈資本等均曾參與其多輪融資。截至當前,SambaNova Systems累計融資已達11.32億美元。
就在去年12月,這家創企一舉推出其最重磅的軟硬體整合平臺SambaNova DataScale,擁有TB級記憶體容量和數百萬PetaFlops低延遲互連計算能力,能處理大量複雜的資料模型。
美國阿貢國家實驗室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實驗室(LLNL)、洛斯阿拉莫斯國家實驗室(LANL)均已應用DataScale來加速AI計算研究。
一、甲骨文元老、斯坦福教授聯合創立,華登國際董事長兼任董事會主席這家初創公司專注於開發處理AI工作負載的基礎設施,總部位於加州帕洛阿爾託,由甲骨文和Sun Microsystems公司的元老Rodrigo Liang、斯坦福大學教授Kunle Olukotun、Chris Ré於2017年成立,提供從資料中心到邊緣執行AI和資料密集型應用的系統。
Liang擔任SambaNova的執行長,Olukotun任首席技術專家,華登國際創始人兼董事長、EDA軟體巨頭Cadence CEO陳立武同時也是SambaNova董事長。
SambaNova創始人合影,左-Kunle Olukotun,中-Rodrigo Liang,右-Chris Ré
Olukotun被稱為“多核處理器之父”,最近獲得了IEEE計算機協會的哈里·H·古德紀念獎(Harry H. Goode Memorial Award)。
他是斯坦福Hydra晶片多處理器(CMP)研究專案的負責人,這個專案研發了一種晶片設計,將四個專用處理器和它們的快取與共享的二級快取相匹配。
Ré是斯坦福大學資訊實驗室計算機科學系的副教授,也是美國跨領域最高獎項之一——麥克阿瑟天才獎(MacArthur genius award)的獲得者,他還隸屬於斯坦福統計機器學習小組(Statistical Machine Learning Group)、普適並行實驗室(Pervasive Parallelism Lab)和斯坦福AI實驗室。
SambaNova董事會成員
二、自研可重構資料流單元、400億電晶體、臺積電7nm製程SambaNova的AI晶片與其客戶很大程度上仍在保密狀態,但該公司此前透露,受DARPA資助的高效AI處理研究啟發,他們正在開發“軟體定義”裝置。
透過演算法最佳化和自定義硬體結合,SambaNova聲稱能顯著提高大多數AI應用的效能和能力。該公司聯合創始人兼CEO Rodrigo Liang分享道,SambaNova並沒有採用市面上主流的Arm和x86架構,而是自主研發了晶片架構。
SambaNova研發的可重構資料流單元Cardinal SN10 RDU包含400億電晶體,採用臺積電7nm製程,由一系列可重構節點組成,用於資料、儲存和交換。
Rodrigo Liang提到,為規避晶片短缺可能帶來的不利影響,SambaNova於去年早些時候進行投資,以確保獲得臺積電的產能。
每個Cardinal晶片有6個記憶體控制器,支援153GB/s頻寬, 8個晶片以全對全配置連線,最後一點是透過允許晶片擴充套件的交換網路實現的。
SambaNova並不是單獨出售Cardinal,而是將其作為一種安裝在資料中心的解決方案。
2020年12月,SambaNova Systems宣佈SambaNova Systems DataScale正式可用,DataScale基於可重構資料流架構(RDA),是一個完全整合的軟體和硬體平臺,可針對從演算法到晶片的資料流進行最佳化,包含SambaFlow軟體棧和8個可重構資料流單元Cardinal SN10 RDU。每個RDU都能支援無縫並行處理大型模型,使企業能夠比當今最先進的解決方案更快地將新的服務和產品推向市場。
SambaNova提供的基本單元被稱為DataScale SN10-8R ,配備了一個AMD處理器,搭配8個Cardinal晶片和12 TB的DDR 4記憶體,或每個Cardinal晶片1.5TB。
SambaNova DataScale SN10-8R執行工作負載的效果
三、對標NVIDIA,4個關鍵領域效能破紀錄SambaNova Systems DataScale專為高效的深度學習推理和訓練而設計,相比最新NVIDIA旗艦A100 GPU,DataScale在四個關鍵領域實現破紀錄的多機架規模效能指標:
(1)效能:DLRM推理的吞吐量比A100高7倍,延遲只有A100的1/7;BERT-Large訓練速度比DGX A100系統快1.4倍。
(2)精度:與DGX A100系統相比,其高解析度計算機視覺的精度達90.23%;與NVIDIA A100 GPU相比,其DLRM推薦引擎的精度達80.46%。
(3)規模:以多機架規模打破BERT-Large訓練和精度的記錄。
(4)易用性:從載入dock到資料中心,DataScale可以在45分鐘內快速輕鬆地整合到任何執行客戶工作負載的現有基礎設施中,數秒內即可在DataScale上以先進精度下載數千個預訓練的Hugging Face Transformer模型,無需更改程式碼。
在軟體方面,SambaNova有自己的圖形最佳化器和編譯器,使用TensorFlow、PyTorch等其他機器學習框架的客戶可以用這些工具為Cardinal重新編譯工作負載。
SambaNova的目標是支援包含超過1000億引數的自然語言處理、高解析度計算機視覺和推薦模型,並提供更大的記憶體佔用和更高的準確性。
與新的SN10-8R產品一起,SambaNova將提供兩種類似雲的服務選項:
第一種是SambaNova AI雲平臺,允許研究機構能免費訪問和使用SambaNova的硬體資源;
第二種是業界首個數據流即服務(DataFlow as a Service),面向想要靈活的雲服務而無需為硬體付費的商業客戶所準備。
四、產品已銷售1年多,落地多個美國實驗室據悉,第一代Cardinal晶片在2019年春季taped out,首批晶片樣品已用於客戶伺服器上。
在此之前,SambaNova的產品已經向客戶銷售了一年多。
美國阿貢國家實驗室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實驗室(LLNL)、洛斯阿拉莫斯國家實驗室(LANL)等多個研究機構,均已部署DataScale平臺來加速研究中的AI計算。
例如,LLNL正將DataScale用在其Corona超級計算機中,用於研發新冠肺炎藥物。
LLNL首席技術官Bronis de Supinski稱,SambaNova的平臺正被用於探索一種被稱為認知模擬的技術,在這種技術中,AI被用來加速部分模擬處理。他聲稱,與執行相同型號的GPU相比,這一效能提高了大約5倍。
五、SambaNova融資背後,AI晶片成各國必爭之地AI晶片是一種專用於加速AI應用的硬體,透過低精度計算、存內計算等技術,提高執行大規模AI演算法的效能。根據全球綜合資料資料庫Statista的一項研究,專用積體電路(ASIC)預計將在推理階段AI邊緣計算處理能力中佔有越來越大的份額,到2025年佔比將達70%。
以SambaNova獲得的新融資為例,多國AI晶片創企正斬獲融資,AI晶片市場正競爭激烈。根據美通社資料,該市場預計2025年將達到911.8億美元。
到2025年,ASIC在推理階段AI邊緣計算處理能力的佔比達70%(來源:Statista)
近期,中國雲端AI晶片創企正經歷著新一輪融資熱潮。天數智芯、壁仞科技、燧原科技、沐曦整合等多家雲端晶片創企宣佈獲得高額新融資,百度AI晶片部門最近在融資後估值為20億美元,中科寒武紀去年成為科創板上市的第一家純AI晶片公司。
在雲端及邊緣AI晶片的研發及落地競賽中,其他國家也有一些備受關注的明星創企。
例如,以色列AI晶片創企Hailo正在開發加快邊緣AI推理速度的硬體,該公司在2020年3月獲得了6000萬美元的風險投資。
美國加州創企Mythic已融資8520萬美元用於開發定製的存內計算架構。
英國AI晶片獨角獸Graphcore致力於研發加速AI工作負載的大規模IPU處理器晶片及系統,該公司擁有數億美元的資金儲備。
隨著AI晶片出現前所未有且持續的客戶需求,SambaNova也是受益者之一。
因新冠肺炎疫情蔓延,汽車和電子產品採購需求的激增加劇了日益嚴重的晶片緊缺。美國總統喬·拜登近期承諾投入1800億美元,用於先進計算的研發和專門用於AI和量子計算的半導體制造,這些都已成為美國國家科技戰略的核心。
結語:AI晶片市場開啟落地與生態之戰2020年以來,多國AI晶片領域均傳出多起融資事件。總體來看,以國內市場為例,據工銀投行資料,2019年國內AI晶片領域投資金額達58.57億元,而2020年僅1-10月的AI晶片總融資額已經超過了2019年全年。企業層面之外,多個國家與地區亦從政策層面出發,扶持AI晶片企業成長。
在這背後,AI晶片創企走過了早期的技術拓荒期,市場或將開啟落地與生態構建新戰事。