NVIDIA發佈“空氣”CPU！性能爆錘Intel，兩年後就能買

北京時間2021年4月13日9點，NVIDIA開啓了GTC 21主題演講，同樣的廚房，依舊皮衣，蓄起了長髮的黃仁勳黃教主為我們帶來了一場盛宴，整場下來，54項重磅發佈，驚喜連連！

其中的重頭戲當然就是黃仁勳正式宣佈的首款數據中心處理器（CPU），據説其運行速度將比現有芯片快10倍。

過去兩年，亞馬遜AWS、華為等都推出了基於Arm架構的服務器芯片。NVIDIA稱，計劃將Arm架構芯片彈性、高效、且節能的優勢擴大至雲端運算、高效能運算、邊緣運算及個人計算機等領域。

因此，NVIDIA也正準備斥資約400億美元收購Arm，以滿足其AI戰略遠景。他們表示，已經與美國、英國、歐盟和中國等地區的監管機構溝通，並預計該交易將在2022年第一季度完成。

在雲端計算方面，NVIDIA和雲服務供貨商AWS共同宣佈將在雲端合作，部署以GPU加速的ARM架構執行裝置，雲端運算服務平台Amazon EC2將整合AWS Graviton2處理器（Arm架構）與NVIDIA GPU，讓遊戲開發者能夠在 AWS 上以原生方式運行Android遊戲、通過NVIDIAGPU加快渲染和編碼速度，移動設備可直接開啓串流遊戲，使玩家可獲得順暢、高分辨率、且運算表現優於以往的遊戲體驗。

據Mercury Research稱，NVIDIA這款新芯片將使NVIDIA和Intel展開正面競爭，不過後者在全球數據中心芯片供應市場上仍佔據主導地位。

NVIDIA發佈首款CPU——Grace

NVIDIA的首款CPU產品使用的依然是目前廣泛出現在移動端設備的Arm架構，他們把這款CPU命名為Grace。這個名字來源於著名計算機科學家葛麗絲·霍普（Grace Hopper），她是最早的女程序員之一，也是“bug”一詞的發明者，還是世界第一個編譯器的發明者。可見NVIDIA這款CPU在名字上就有相當的分量。

Grace是一款專為大規模人工智能和高性能計算應用而設計的CPU，就像黃仁勳所説：“這是世界第一款為terabyte（萬億字節）級別計算設計的CPU，Grace將充分彰顯出Arm的強大。”絕大多數的數據中心仍將繼續使用現有的CPU，而Grace主要將用於計算領域的細分市場。

由於超大規模的模型很難完全放進GPU內存，如果存儲在系統內存，訪問速度則會大大受限，Grace的問世主要即是為了解決這一瓶頸，具體有以下三點創新進步：

（1）內置下一代Arm Neoverse內核，每個CPU能在SPECrate2017_int_base基準測試中分數超過300分；

（2）採用第四代NVIDIA NVLink，從CPU到GPU連接速度超過900GB/s，達到相當於目前服務器14倍的帶寬；從CPU到CPU的速度超過600GB/s；

（3）擁有最高的內存帶寬，採用的新內存LPDDR5x技術，帶寬是LPDDR4的兩倍，能源效率提高了10倍，能提供更多計算能力。

總的來説Grace並不會很快出現在個人PC上，因為NVIDIA將其作為用於AI超級計算機和自然語言處理等超大數據量的數據中心CPU。不過瑞士國家超級計算機中心（CSCS）和美國能源部洛斯阿拉莫斯國家實驗室（Los Alamos National Laboratory）已經率先宣佈計劃構建搭載Grace的超級計算機，以支持國家科學研究工作。

不過極果君認為這是CPU自誕生以來被黑的最慘的一次，因為這個Grace架構完全是為了GPU服務的。CPU 的存在就是讓GPU隨心所欲訪問內存, 佔用系統資源, 針對的也是dl的工作量, 只能説在當下是一個極限的DNN煉丹機器。不過一般的數據中心也不需要這麼高的並行度，看起來並不會對 Intel Xeon造成太大威脅。

有的網友也開始調侃老黃髮布了一款“空氣CPU”，和RTX 30系顯卡因為買不到而被叫做“空氣”不一樣，這款Grace正式發佈時間在2年後，什麼整數浮點運算性能、主頻參數統統沒有，連製程工藝也語焉不詳。NVIDIA只在發佈會上透露，Grace在SPECrate2017_int_base基準測試中超過300分，可以與AMD第二代64核EPYC中的某些CPU相媲美。再看看這一個月裏AMD和Intel發佈的服務器GPU那一大串參數，這不就是“空氣”嗎！

不過什麼參數都沒有，唯一參數也只和AMD上一代ETPC持平，老黃為何敢拍着胸脯説Grace比其他x86架構強10倍呢？這就跟上文提到的數據傳輸有關了，因為，在數據傳輸速度這件事上，Grace比AMD和Intel跑得快多了。

未來計算的三大支柱盡收囊中

黃仁勳還説道：“我們的數據中心產品線將由3種芯片組成：CPU、GPU、DPU，每款芯片將打造兩年，一年專注x86平台，一年則專注Arm平台，每一年都會推出令人興奮的產品，NVIDIA架構平台將同時支持x86跟Arm，無論客户要什麼我們都能滿足。”

原本NVIDIA的GPU起初為遊戲與視頻設計，但近年來成為開發AI應用不可或缺的基礎設施。黃仁勳更是已將目光放到了整個數據中心市場上，去年，NVIDIA宣佈推出DPU（數據處理器），接管數據中心的更多任務。

大會上推出的全新BlueField-3 DPU包含220億個晶體管，採用16個Arm A78 CPU核心、18M IOPs彈性塊存儲，加密速度是上一代的4倍，並完全向下兼容BlueField-2。

BlueField-2能夠負載相當於30個CPU核的工作，而BlueField-3實現了10倍的加速計算性能提升，能夠替代300個CPU核，以400Gbps的速率，對網絡流量進行保護、卸載和加速。該處理器也是首款支持第五代PCIe總線並提供數據中心時間同步加速的DPU。

新一代BlueField-3 DPU預計將於2022年第一季度發佈樣品。這樣下來，作為GPU霸主的NVIDIA發佈首款CPU之後，也宣告着他們集齊了數據中心產品線CPU、GPU、DPU這“未來計算的三大支柱”。

如何看待NVIDIA的全家桶？

NVIDIA這波是“小孩子才做選擇，我全都要！”雖然本質上沒有芯片級的原創，但是在組合上，做出了新的夾心蛋糕，感覺會符合大佬們新的口味。

總體來看，NVIDIA的優勢在於，通過GPU+CPU+DPU的產品組合，能夠最大程度維持其在AI領域優勢，加上軟件和系統的優化，更好地滿足新興應用的需求，在新的市場佔據領導力，而非與競爭對手搶奪已有的市場。

所以現在對於老黃來説，簡直是不可多得的發佈服務器CPU和AI解決方案的時機，我們可以等過兩年看看成品，拭目以待事態進展。