楠木軒

超越全球最大7nm芯片A100!Graphcore第二代IPU晶體管數量高達594億個

由 回秀蘭 發佈於 科技

雷鋒網消息,總部位於英國的AI芯片公司Graphcore今天發佈了第二代IPU GC200,採用台積電7nm工藝,晶體管數量高達594億個,裸片面積達到823平方毫米。這比兩個月前英偉達最新發布的安培架構GPU A100的540億個晶體管增加了10%,黃仁勳當時説A100是全球最大的7nm芯片,裸片面積為826平方毫米。

IPU是一種全新的大規模並行處理器,雷鋒網此前報道,已經推出了基於台積電16nm工藝集成236億個晶體管的GC2 IPU,120瓦的功耗下有125TFlops的混合精度、300M的SRAM能夠把完整的模型放在片內。

第二代IPU GC2000(MK2)與第一代IPU(MK1)相比,實際性能提高了8倍。Graphcore聯合創始人兼CEO Nigel Toon表示,GC200是目前世界上最複雜的處理器,可使創新者實現AI的革命性突破。

Mk1 IPU產品與Mk2 IPU產品性能對比

據悉,GC2000芯片內部有1,472個獨立的處理器內核,能夠執行8,832個獨立的並行線程,所有這些均由900MB的RAM支持。

Nigel説:“GC200在處理器內部具有史無前例的900MB超高速SRAM,在每個處理器內核旁邊都設有大量RAM,以實現每位最低能量的訪問。Graphcore的Poplar軟件還允許IPU通過Graphcore獨特的Exchange-Memory通信訪問Streaming Memory。這甚至可以支持具有數千億個參數的最大模型。每個IPU-M2000都可以支持密度高達450GB的Exchange-Memory,以及前所未有的180TB/秒的帶寬。”

Graphcore IPU-Fabric技術

除此之外,基於最新GC200的一款即插即用的機器智能刀片式計算單元IPU-M2000還集成了Graphcore的專用AI聯網IPU-Fabric。新的Graphcore GC4000 IPU-Gateway芯片可以讓每個IPU-M2000提供2.8Tbps。Graphcore稱,在從數十個IPU擴展到數以萬計個IPU的過程中,IPU-Fabric技術使通信時延幾乎保持恆定。

據悉,1U大小的IPU-M2000可提供1個PetaFlop的機器智能計算。利用IPU-M2000可構建成IPU-POD64的模塊化機架規模解決方案。IPU-M2000的設計使客户可以在IPU-POD配置中構建多達64,000個IPU的數據中心規模系統,提供16ExaFlops的機器智能計算能力。

Graphcore也強調,其Poplar SDK可以使開發者無論使用單個IPU還是要使用數千個IPU完成機器智能工作負載都可以讓過程變得簡單。

Graphcore高級副總裁兼中國區總經理盧濤表示,中國很可能成為Graphcore最新推出的第二代處理器技術最先實現商業化落地的區域之一。雷鋒網