英偉達推出ARM架構CPU,性能10倍領先
還是熟悉的廚房、熟悉的皮衣,4月13日凌晨,NVIDIA GTC2021如約而至。NVIDIA創始人黃仁勳的主題演講作為GTC的重頭戲,果然沒有讓人失望,其在演講中重磅發佈了多款產品,其中三款基於Arm IP打造的處理器尤為引人關注:
NVIDIA Grace:專為大規模人工智能和高性能計算應用而設計
BlueField-3 DPU:首款支持第五代PCIe總線並提供數據中心時間同步加速的DPU
NVIDIA DRIVE Atlan:新一代AI自動駕駛汽車處理器,算力將達到1000TOPS
英偉達CPU問世
GTC大會期間,黃仁勳在接受集微網電話採訪時表示,英偉達收購Arm正在穩妥有序進行。儘管收購尚未塵埃落定,但英偉達已經開始了基於Arm IP的研發,打造了一款專為大規模人工智能和高性能計算應用而設計的CPU——NVIDIA Grace。目前,絕大多數的數據中心仍將繼續使用現有的CPU,而Grace主要將用於計算領域的細分市場。黃仁勳介紹道,“結合 GPU 和 DPU,Grace 為我們提供了第三種基礎計算能力,並具備重新定義數據中心架構,推進 AI 前進的能力。”
Grace 的名字來自於計算機科學家、世界最早一批的程序員,也是最早的女性程序員之一的格蕾絲 · 赫柏(Grace Hopper)。她創造了現代第一個編譯器 A-0 系統,以及第一個高級商用計算機程序語言「COBOL」。計算機術語「Debug」(調試)便是她在受到從電腦中驅除蛾子的啓發而開始使用的,於是她也被冠以「Debug 之母」的稱號。
Grace CPU是NVIDIA首次使用下一代 Arm Neoverse 內核的設計,採用了更為先進的 5nm 製程,在內部通信能力上,它使用了英偉達第四代 NVIDIA NVLink,在 CPU 和 GPU 之間提供高達 900 GB/s 的雙向帶寬,相比之前的產品提升了八倍。整個SoC是由多個芯片組合構成,它主要有三個部分,分別是CPU、GPU和內存/IO子系統。Grace是一款高度專業化的處理器,主要解決工作負載問題,例如訓練擁有超過1萬億個參數的下一代NLP模型。當與英偉達GPU緊密結合時,基於Grace CPU的系統將比當今最先進的基於英偉達DGX的系統(運行在x86 CPU上)的性能還要快10倍。
此外,Grace 還是第一個通過錯誤校正代碼(ECC)等機制利用 LPDDR5x 內存系統提供服務器級可靠性的 CPU,同時提供 2 倍的內存帶寬和高達 10 倍的能源效率。對Grace的性能,黃仁勳如此總結道:“Grace能充分彰顯出Arm的強大。”
雖然是首次出現在大眾視野中,但目前Grace已經找到了至少兩個客户——瑞士國家超級計算中心(CSCS)將採用Grace,構建一台名為Alps的超級計算機,其算力可達20Exaflops;美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)即將推出的超級計算機也將採用Grace。
三類芯片,逐年飛躍
GTC2021上,除了推出首款CPU“炸圈”外,英偉達的DPU同樣值得關注。“我們每年都會發布激動人心的新品。三類芯片,逐年飛躍,一個架構。”黃仁勳説,數據中心路線圖包括CPU、GPU和DPU這三類芯片,而Grace和BlueField是其中必不可少的關鍵組成部分。
英偉達全新推出的BlueField-3 DPU包含220億個晶體管,採用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,並完全向下兼容BlueField-2。據悉,BlueField-2能夠卸載相當於30個CPU核的工作負載,而BlueField-3實現了10倍的加速計算性能提升,能夠替代300個CPU核,以400Gbps的速率對網絡流量進行保護、卸載和加速。該處理器也是首款支持第五代PCIe總線並提供數據中心時間同步加速的DPU。此外,黃仁勳還發布了英偉達新一代AI自動駕駛汽車處理器——NVIDIA DRIVE Atlan,其算力將達到1000TOPS,約是上一代Orin處理器的4倍,超過了絕大多數L5無人駕駛出租車的總計算能力。黃仁勳提出,“對於汽車而言,更高的算力意味着更加智能化,開發者們也能讓產品更快迭代。TOPS就是新的馬力。”
該SoC採用下一代GPU的體系結構、新型Arm CPU內核、新深度學習和計算機視覺加速器,並內置為先進的網絡、存儲和安全服務的BlueField DPU,網絡速度可達400Gbps。同時,這也是DRIVE平台首次集成DPU,通過Arm核為自動駕駛汽車帶來數據中心級的網絡。
除了NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan這三款基於Arm IP打造的處理器外,黃仁勳還提到了AI-on-5G計算平台,這是一款專為邊緣設計、將5G和AI相結合的新型計算平台,將採用NVIDIA Aerial軟件開發套件與NVIDIA BlueField-2 A100,將GPU和CPU組合成“有史以來最先進的PCIE卡。”目前,富士通、谷歌雲、Mavenir、Radisys和Wind River等合作伙伴都在開發適用於NVIDIA AI-on-5G平台的解決方案。
佈局Arm生態
從自研三類芯片到GPU合作伙伴,從雲、高性能計算、邊緣計算到PC,不難看出英偉達對於Arm生態的重視程度。
為亞馬遜AWS Graviton2 CPU提供GPU加速
2021年下半年,基於AWS Graviton2的Amazon EC2實例將與NVIDIA GPU相結合,在雲端部署,可實現降低成本、支持更豐富的遊戲串流體驗、優化雲上安卓遊戲和人工智能推理、以更低成本提供更高的AI推理性能等優勢。
為科學和AI應用開發提供支持的全新HPC開發者套件
NVIDIA全新HPC開發者套件為超級計算機提供了一個高性能、高能效的平台,該平台結合了1個Ampere Altra CPU(包含80個Arm Neoverse核,運行頻率高達3.3GHz)、雙NVIDIA A100 GPU(每個GPU可提供312TFLOPS的FP16深度學習性能)、兩個用於加速網絡、存儲和安全的NVIDIA BlueField-2 DPU。
提升邊緣視頻分析和安全功能
NVIDIA正擴大與Marvell的合作,將基於Arm的OCTEON DPU與GPU相結合,加速AI工作負載,實現網絡優化和安全。
打造新一類基於Arm並搭載NVIDIA RTX GPU的新款PC
NVIDIA將與聯發科合作,共同打造一個採用Arm核與NVIDIA顯卡、支持Chromium、Linux和NVIDIA SDK的參考平台,將GPU的性能及先進的AI、光線追蹤圖形等技術帶入Arm PC平台。
寫在最後
黃仁勳在NVIDIA GTC2021上公佈了多項最新成果與研發進展,首款數據中心CPU的發佈,也宣告着英偉達數據中心產品線正式集齊了“未來計算的三大支柱”——CPU、GPU、DPU,從英偉達在Arm身上“下的功夫”便不難看出其在CPU領域的野心。英偉達每年在GTC大會上發佈的新品已經成為了行業發展的重要指向,而正如黃仁勳所説,“新時代的計算機需要新的芯片、新的系統架構、新的網絡、新的軟件和工具。”不知今天過後,芯片圈的風向要怎麼變呢?
參考資料:
1、《英偉達CPU問世:ARM架構,對比x86實現十倍性能提升》,機器之心
2、《英偉達CPU面世!基於Arm,性能超過英特爾為核心的自家系統10倍,連客户都找好了》,大數據文摘
3、《芯片圈變天了!英偉達推出首個CPU,狂捧Arm生態》,智東西
4、《英偉達發佈“空氣CPU”,Arm架構專為AI而生,性能超x86十倍,與自家GPU更搭》,量子位
5、《NVIDIA發佈首款代號為“Grace”的CPU 基於ARM架構與Neoverse核心》,cnBeta.COM