來源:內容來自半導體行業觀察綜合,謝謝。
幾年前,我們看到研究人員開始討論一種在上世紀八十年代出現的古老製造思想:晶圓級加工(Wafer-scale processing,簡稱WSP)。WSP的想法很簡單,那就是不要將晶圓切成單個芯片,然後將這些芯片封裝以進行轉售,而是使用單個芯片的大量(如果不是全部)晶圓來構建單個內核或內核集合。
人工智能/機器學習初創公司Cerebras去年推出的第一代處理器就是採用了這種方法。“舊的” Cerebras晶圓規模引擎(CWSE)是使用16納米工藝打造的晶圓,具有400,000個AI核,1.2T晶體管,18GB板載內存,9 PB / s的總內存帶寬和100Pb / s的總結構帶寬。據説CWSE的新版本更大:
如上圖所示,新芯片有很多晶體管和核心,功耗也許也不小,儘管其他公司的數據表明從16nmFF到7nm的轉換可以節省大量功耗,但WSE也許並不會這樣。到目前為止,Cerebras的芯片一直是AI市場的突破寵兒之一。
Cerebras利用宏觀方法解決了微觀問題。具有諷刺意味的是,小芯片和晶圓級設計都是試圖為現代計算的封裝和能源效率問題找到解決方案。小芯片專注於優化裸片面積並將處理器分解為功能塊,這些功能塊最適合於它們所部署到的過程節點。Chiplets駁斥了長期以來摩爾定律的宗旨,即集成永遠是最好的,而是專注於在仍然可行的情況下集成組件。晶圓級處理還處理集成。但是從系統作為一個整體平台的角度來看,它繞開了很多集成,並且支持功能塊之間的根本不同的關係。
Cerebras晶圓級引擎(已組裝)。圖片來自Cerebras
傳統上,CPU或GPU是連接到安裝在PCB上的封裝的硅片(如果沒有其他限制,則由晶圓廠的最大標線大小限制)。安裝4-10個加速器板的單個母板也是一個集成系統,並且其中一個內部效率很低,Cerebras繞開了通常通常會阻止晶圓級處理器可行的製造限制。在這兩種情況下,採用不同的集成方法都會產生根本的改進,而相同的舊方法已經使我們失敗了。
當然,小芯片和WSE之間有一個主要區別:小芯片已經可以在AMD的消費產品中使用,而晶圓級引擎消耗的功率約為15kW,僅可用於個人安裝在服務器甚至月球基地中。
以下為Cerebras在hotchip演講PPT:
【來源:半導體行業觀察】
聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:[email protected]