英國芯片設計公司 Imagination Technologies,剛剛推出了面向高級輔助駕駛(ADAS)市場、名為 IMG Series4 NNA 的神經網絡新平台。 在今日的公告中,該公司稱:隨着電動汽車的出現,已經蜂窩移動車聯網(C-V2X)連接平台的興起,汽車行業正在更加積極地擁抱新平台。
據悉,Imagination 的 IMG Series4 NNA 平台建立在三大基礎上。公司宣稱這不僅使之能夠大規模擴展性能,還可減少延遲和帶寬功耗管理等工作負載。
性能方面,Imagination 預計 Series4 神經加速器核心可達成介於每秒 12.5 ~ 500 萬億次的運算(TOPS)。
此外通過高帶寬互連方案將單個 Series4 與其它內核彼此相連,Imagination 還能夠組建最高 8 路的系統集羣。
集羣中的內核不僅支持互連,也可通過系統總線來分隔出一組四個內核,輔以 DDR DRAM 和內核上的緩存(OCM)。
Imagination 還承諾 Series4 平台可提供高達 30 TOPS / Watt 的能效,以及 12 TOPS / mm的性能/單位面積。
更重要的是,這些芯片將基於最新的 5nm 工藝節點製造(比如台積電或 三星 等巨頭代工)。
其次,張量平鋪設計使得 Series4 NNA 平台能夠進一步減少延遲。多核 / 多集羣設計允許核心同時執行多項工作負載,或專注於單個工作負載。
若所有內核都被調配用於單一任務,則系統等待時間(處理器接收輸入至生成輸出的時間間隔),會在一定程度上減少已分配給該任務的內核數量。
如此一來,預計執行單一任務的單個內核,與執行相同任務的八核集羣之間的延遲差異,會被拉大至 8 倍左右。
此外內存管理也是 Series4 NNA 平台上一個不可或缺的功能,Imagination 將之稱作 Tensor Tiling(等待專利審批中),可節省高達 90% 的帶寬開銷。
因其允許將神經網絡數據隔離為一個子集的子集,層數越多,神經網絡的構建也就更復雜。
接着通過張量平鋪來批處理劃分子集,並經由 NNA 核心進行處理,以減少等待延遲和整體事務處理過程中對外部存儲器的依賴。
最後,Imagination 揭示了在添加更多內核情況下,Series4 平台的性能指標也可大致維持線性增長。
數據表明,對於某些類型的工作負載(34 層 @ 2400×1200 的殘量網絡),其性能亦可完美地線性縮放。
當層數增加到 50,且輸入圖像分辨率降低至 224×224 時,線性縮放可近似至六個核心,之後這一梯度曲線才會開始向下彎曲。
此外 Series4 也符合 ISO2626 標準,能夠為汽車製造商達成更高的自動輔助駕駛水平而提供助力,以及為開發者提供處理各項應用時的張量平鋪優勢。
【來源:cnBeta.COM】