30分鐘訓練新冠肺炎影像演算法!比GPU快10倍,Graphcore打造超強AI晶片

30分鐘訓練新冠肺炎影像演算法!比GPU快10倍,Graphcore打造超強AI晶片

芯東西

編 | 溫淑

芯東西6月1日訊息,近日,微軟機器學習科學家展示了英國AI晶片明星創企Graphcore自研AI晶片的加速效果,該晶片在執行微軟新冠肺炎影像分析演算法SONIC時表現亮眼,據稱能在30分鐘內完成NVIDIA傳統晶片需5個小時的訓練工作量。

兩週前,NVIDIA釋出了其最新AI晶片A100。Graphcore CEO Nigel Toon稱,Graphcore第二代處理器將在今年晚些時候釋出,並預計其效能將超過NVIDIA A100。

科技媒體ZDNet認為,在未來,像Graphcore這樣的平行計算晶片或可用於支援最先進的神經網路,有可能為NVIDIA等傳統晶片巨頭帶來威脅。

一、Graphcore獲超過4.5億美元風投,或有上市計劃

英國AI晶片初創公司Graphcore成立於2016年,總部位於英國布里斯托爾市。目前,Graphcore已經籌集了超過4.5億美元的風險投資基金,其中包括二月份D輪融資的1.5億美元。最近一次注資後,Graphcore的估值為略低於20億美元;截至今年二月份,Graphcore在銀行的資產為3億美元。

Toon透露,Graphcore的投資者包括“一些科技公開市場中最大的投資者”,比如英國投資管理公司Baillie Gifford,以及微軟公司、博世公司、寶馬公司和谷歌DeepMind AI部門聯合創始人Demis Hassabis等。

“像Baillie Gifford這樣的公司投資了Graphcore,顯然是因為預料到我們可能在未來的某個時間點上市。”Toon說。目前,Toon並未透露公司具體上市時間。

二、IPU架構:1216個IPU核心、片上記憶體頻寬45TB/s

現有計算機常按時序執行任務,即先做一件事、然後再做下一件事,而AI演算法存在大量重複性簡單計算任務,用平行計算效率更高。

對此,Graphcore的智慧處理單元(IPU)採用自研大規模並行同構多核架構,包含1216個獨立IPU核心。

30分鐘訓練新冠肺炎影像演算法!比GPU快10倍,Graphcore打造超強AI晶片

▲Graphcore IPU由1216個並行運算的IPU核心組成

隨著計算速度需求不斷提升,AI晶片還需要更高的記憶體容量和頻寬。

由於從GPU到計算機主儲存器的速度遠比不了片上記憶體訪問的速度,Graphcore在IPU架構中採用大量片上記憶體,容量為300 MB,頻寬達45 TB/s。

三、30分鐘內完成訓練,NVIDIA傳統晶片需花5小時

在Intelligent Health 2020峰會上,微軟機器學習科學家Sujeeth Bharadwaj展示了他對Graphcore晶片的應用。Bharadwaj使SONIC神經網路在Graphcore晶片上執行,並將其用於識別新冠肺炎患者的胸透影象。

系統執行結果顯示,Graphcore晶片可在30分鐘內完成NVIDIA的傳統晶片5個小時的訓練工作量。

Bharadwaj稱,執行結果顯示SONIC神經網路和Graphcore晶片之間形成了“非常強大的協同作用”。

30分鐘訓練新冠肺炎影像演算法!比GPU快10倍,Graphcore打造超強AI晶片

▲Sujeeth Bharadwaj展示SONIC神經網路和Graphcore晶片的應用

Graphcore CEO Toon認為,以SONIC神經網路為例,IPU將能夠用於開發頂尖AI模型。“我認為IPU能夠幫助創新者做到的一件事是建立下一代影象感知模型,使它們執行起來更加準確、更加高效。”他說。

另外,Toon稱,IPU除了被設計用於支援機器視覺這類複雜的演算法外,還適用於加速自然語言處理等存在稀疏化的模型。

對於Graphcore IPU的效能,Toon表示出信心,認為第二代IPU有可能超過NVIDIA的A100。

對此,晶片行業媒體Microprocessor Report編輯Linley Gwennap表示懷疑。他認為,NVIDIA的產品的效能標準“遠遠超過所有的現有產品”,其他競爭者難以超越。Gwennap對英特爾收購的Habana也表示看好,他稱Habana晶片的基準測試結果優於NVIDIA V100和Graphcore的產品。“一旦英特爾將其龐大的AI軟體棧覆蓋到Habana硬體,這種組合將遠遠勝過任何初創公司的平臺。”他說。

結語:Graphcore能成為新的AI晶片領跑者嗎?

早在神秘的潛心研發階段,Graphcore就因曾獲得微軟、寶馬、戴爾、三星等巨頭的融資而備受矚目,成為英國盛名在外的AI晶片明星創企之一。

成立僅有4年的Graphcore成長速度已算驚人。其IPU晶片擁有超過1000個獨立IPU核,並且激進地採用了大量片上記憶體單元,同時為AI訓練和推理提供超快的加速計算能力。

就最新微軟機器學習科學家展示的新冠肺炎影像分析演算法示例來看,Graphcore能做到10倍於NVIDIA傳統晶片的訓練速度,但暫不清楚具體是和哪款NVIDIA GPU進行的比較。

繼去年11月與微軟達成合作,釋出微軟雲Azure上的IPU預覽版外,Graphcore還於今年5月的Wave Summit 2020深度學習開發者峰會上,宣佈成為百度飛槳硬體生態圈共建計劃夥伴之一,加速機器視覺、自然語言處理等演算法模型與硬體的適配與落地。

總體來看,Graphcore在IPU架構上融合了相當多的創新精神,並於過去半年著力將產品推向中美雲端AI市場,而Graphcore的AI晶片在落地實踐中效果究竟如何,還有待市場的檢驗。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 2191 字。

轉載請註明: 30分鐘訓練新冠肺炎影像演算法!比GPU快10倍,Graphcore打造超強AI晶片 - 楠木軒