芯東西(公眾號:aichip001)
作者 | 温淑
編輯 | 心緣
芯東西4月14日消息,美國明星AI芯片獨角獸SambaNova Systems最新宣佈D輪融資6.76億美元(摺合44億人民幣),由軟銀願景基金2領投,英特爾資本、谷歌風投、華登國際等參投。
至此,該公司估值超過50億美元(摺合327億人民幣),成為全球估值最高的人工智能(AI)創企之一。
這家脱胎於斯坦福大學的AI芯片創企,長期受到知名投資者的青睞,英特爾資本、谷歌風投、華登國際、貝萊德、紅鏈資本等均曾參與其多輪融資。截至當前,SambaNova Systems累計融資已達11.32億美元。
就在去年12月,這家創企一舉推出其最重磅的軟硬件集成平台SambaNova DataScale,擁有TB級內存容量和數百萬PetaFlops低延遲互連計算能力,能處理大量複雜的數據模型。
美國阿貢國家實驗室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實驗室(LLNL)、洛斯阿拉莫斯國家實驗室(LANL)均已應用DataScale來加速AI計算研究。
一、甲骨文元老、斯坦福教授聯合創立,華登國際董事長兼任董事會主席這家初創公司專注於開發處理AI工作負載的基礎設施,總部位於加州帕洛阿爾託,由甲骨文和Sun Microsystems公司的元老Rodrigo Liang、斯坦福大學教授Kunle Olukotun、Chris Ré於2017年成立,提供從數據中心到邊緣運行AI和數據密集型應用的系統。
Liang擔任SambaNova的首席執行官,Olukotun任首席技術專家,華登國際創始人兼董事長、EDA軟件巨頭Cadence CEO陳立武同時也是SambaNova董事長。
SambaNova創始人合影,左-Kunle Olukotun,中-Rodrigo Liang,右-Chris Ré
Olukotun被稱為“多核處理器之父”,最近獲得了IEEE計算機協會的哈里·H·古德紀念獎(Harry H. Goode Memorial Award)。
他是斯坦福Hydra芯片多處理器(CMP)研究項目的負責人,這個項目研發了一種芯片設計,將四個專用處理器和它們的緩存與共享的二級緩存相匹配。
Ré是斯坦福大學信息實驗室計算機科學系的副教授,也是美國跨領域最高獎項之一——麥克阿瑟天才獎(MacArthur genius award)的獲得者,他還隸屬於斯坦福統計機器學習小組(Statistical Machine Learning Group)、普適並行實驗室(Pervasive Parallelism Lab)和斯坦福AI實驗室。
SambaNova董事會成員
二、自研可重構數據流單元、400億晶體管、台積電7nm製程SambaNova的AI芯片與其客户很大程度上仍在保密狀態,但該公司此前透露,受DARPA資助的高效AI處理研究啓發,他們正在開發“軟件定義”設備。
通過算法優化和自定義硬件結合,SambaNova聲稱能顯著提高大多數AI應用的性能和能力。該公司聯合創始人兼CEO Rodrigo Liang分享道,SambaNova並沒有採用市面上主流的Arm和x86架構,而是自主研發了芯片架構。
SambaNova研發的可重構數據流單元Cardinal SN10 RDU包含400億晶體管,採用台積電7nm製程,由一系列可重構節點組成,用於數據、存儲和交換。
Rodrigo Liang提到,為規避芯片短缺可能帶來的不利影響,SambaNova於去年早些時候進行投資,以確保獲得台積電的產能。
每個Cardinal芯片有6個內存控制器,支持153GB/s帶寬, 8個芯片以全對全配置連接,最後一點是通過允許芯片擴展的交換網絡實現的。
SambaNova並不是單獨出售Cardinal,而是將其作為一種安裝在數據中心的解決方案。
2020年12月,SambaNova Systems宣佈SambaNova Systems DataScale正式可用,DataScale基於可重構數據流架構(RDA),是一個完全集成的軟件和硬件平台,可針對從算法到芯片的數據流進行優化,包含SambaFlow軟件棧和8個可重構數據流單元Cardinal SN10 RDU。每個RDU都能支持無縫並行處理大型模型,使企業能夠比當今最先進的解決方案更快地將新的服務和產品推向市場。
SambaNova提供的基本單元被稱為DataScale SN10-8R ,配備了一個AMD處理器,搭配8個Cardinal芯片和12 TB的DDR 4內存,或每個Cardinal芯片1.5TB。
SambaNova DataScale SN10-8R運行工作負載的效果
三、對標NVIDIA,4個關鍵領域性能破紀錄SambaNova Systems DataScale專為高效的深度學習推理和訓練而設計,相比最新NVIDIA旗艦A100 GPU,DataScale在四個關鍵領域實現破紀錄的多機架規模性能指標:
(1)性能:DLRM推理的吞吐量比A100高7倍,延遲只有A100的1/7;BERT-Large訓練速度比DGX A100系統快1.4倍。
(2)精度:與DGX A100系統相比,其高分辨率計算機視覺的精度達90.23%;與NVIDIA A100 GPU相比,其DLRM推薦引擎的精度達80.46%。
(3)規模:以多機架規模打破BERT-Large訓練和精度的記錄。
(4)易用性:從加載dock到數據中心,DataScale可以在45分鐘內快速輕鬆地集成到任何運行客户工作負載的現有基礎設施中,數秒內即可在DataScale上以先進精度下載數千個預訓練的Hugging Face Transformer模型,無需更改代碼。
在軟件方面,SambaNova有自己的圖形優化器和編譯器,使用TensorFlow、PyTorch等其他機器學習框架的客户可以用這些工具為Cardinal重新編譯工作負載。
SambaNova的目標是支持包含超過1000億參數的自然語言處理、高分辨率計算機視覺和推薦模型,並提供更大的內存佔用和更高的準確性。
與新的SN10-8R產品一起,SambaNova將提供兩種類似雲的服務選項:
第一種是SambaNova AI雲平台,允許研究機構能免費訪問和使用SambaNova的硬件資源;
第二種是業界首個數據流即服務(DataFlow as a Service),面向想要靈活的雲服務而無需為硬件付費的商業客户所準備。
四、產品已銷售1年多,落地多個美國實驗室據悉,第一代Cardinal芯片在2019年春季taped out,首批芯片樣品已用於客户服務器上。
在此之前,SambaNova的產品已經向客户銷售了一年多。
美國阿貢國家實驗室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實驗室(LLNL)、洛斯阿拉莫斯國家實驗室(LANL)等多個研究機構,均已部署DataScale平台來加速研究中的AI計算。
例如,LLNL正將DataScale用在其Corona超級計算機中,用於研發新冠肺炎藥物。
LLNL首席技術官Bronis de Supinski稱,SambaNova的平台正被用於探索一種被稱為認知模擬的技術,在這種技術中,AI被用來加速部分模擬處理。他聲稱,與運行相同型號的GPU相比,這一性能提高了大約5倍。
五、SambaNova融資背後,AI芯片成各國必爭之地AI芯片是一種專用於加速AI應用的硬件,通過低精度計算、存內計算等技術,提高運行大規模AI算法的性能。根據全球綜合數據資料庫Statista的一項研究,專用集成電路(ASIC)預計將在推理階段AI邊緣計算處理能力中佔有越來越大的份額,到2025年佔比將達70%。
以SambaNova獲得的新融資為例,多國AI芯片創企正斬獲融資,AI芯片市場正競爭激烈。根據美通社數據,該市場預計2025年將達到911.8億美元。
到2025年,ASIC在推理階段AI邊緣計算處理能力的佔比達70%(來源:Statista)
近期,中國雲端AI芯片創企正經歷着新一輪融資熱潮。天數智芯、壁仞科技、燧原科技、沐曦集成等多家雲端芯片創企宣佈獲得高額新融資,百度AI芯片部門最近在融資後估值為20億美元,中科寒武紀去年成為科創板上市的第一家純AI芯片公司。
在雲端及邊緣AI芯片的研發及落地競賽中,其他國家也有一些備受關注的明星創企。
例如,以色列AI芯片創企Hailo正在開發加快邊緣AI推理速度的硬件,該公司在2020年3月獲得了6000萬美元的風險投資。
美國加州創企Mythic已融資8520萬美元用於開發定製的存內計算架構。
英國AI芯片獨角獸Graphcore致力於研發加速AI工作負載的大規模IPU處理器芯片及系統,該公司擁有數億美元的資金儲備。
隨着AI芯片出現前所未有且持續的客户需求,SambaNova也是受益者之一。
因新冠肺炎疫情蔓延,汽車和電子產品採購需求的激增加劇了日益嚴重的芯片緊缺。美國總統喬·拜登近期承諾投入1800億美元,用於先進計算的研發和專門用於AI和量子計算的半導體制造,這些都已成為美國國家科技戰略的核心。
結語:AI芯片市場開啓落地與生態之戰2020年以來,多國AI芯片領域均傳出多起融資事件。總體來看,以國內市場為例,據工銀投行數據,2019年國內AI芯片領域投資金額達58.57億元,而2020年僅1-10月的AI芯片總融資額已經超過了2019年全年。企業層面之外,多個國家與地區亦從政策層面出發,扶持AI芯片企業成長。
在這背後,AI芯片創企走過了早期的技術拓荒期,市場或將開啓落地與生態構建新戰事。