北京時間2021年4月13日9點,NVIDIA開啓了GTC 21主題演講,同樣的廚房,依舊皮衣,蓄起了長髮的黃仁勳黃教主為我們帶來了一場盛宴,整場下來,54項重磅發佈,驚喜連連!
其中的重頭戲當然就是黃仁勳正式宣佈的首款數據中心處理器(CPU),據説其運行速度將比現有芯片快10倍。
過去兩年,亞馬遜AWS、華為等都推出了基於Arm架構的服務器芯片。NVIDIA稱,計劃將Arm架構芯片彈性、高效、且節能的優勢擴大至雲端運算、高效能運算、邊緣運算及個人計算機等領域。
因此,NVIDIA也正準備斥資約400億美元收購Arm,以滿足其AI戰略遠景。他們表示,已經與美國、英國、歐盟和中國等地區的監管機構溝通,並預計該交易將在2022年第一季度完成。
在雲端計算方面,NVIDIA和雲服務供貨商AWS共同宣佈將在雲端合作,部署以GPU加速的ARM架構執行裝置,雲端運算服務平台Amazon EC2將整合AWS Graviton2處理器(Arm架構)與NVIDIA GPU,讓遊戲開發者能夠在 AWS 上以原生方式運行Android遊戲、通過NVIDIAGPU加快渲染和編碼速度,移動設備可直接開啓串流遊戲,使玩家可獲得順暢、高分辨率、且運算表現優於以往的遊戲體驗。
據Mercury Research稱,NVIDIA這款新芯片將使NVIDIA和Intel展開正面競爭,不過後者在全球數據中心芯片供應市場上仍佔據主導地位。
NVIDIA發佈首款CPU——GraceNVIDIA的首款CPU產品使用的依然是目前廣泛出現在移動端設備的Arm架構,他們把這款CPU命名為Grace。這個名字來源於著名計算機科學家葛麗絲·霍普(Grace Hopper),她是最早的女程序員之一,也是“bug”一詞的發明者,還是世界第一個編譯器的發明者。可見NVIDIA這款CPU在名字上就有相當的分量。
Grace是一款專為大規模人工智能和高性能計算應用而設計的CPU,就像黃仁勳所説:“這是世界第一款為terabyte(萬億字節)級別計算設計的CPU,Grace將充分彰顯出Arm的強大。”絕大多數的數據中心仍將繼續使用現有的CPU,而Grace主要將用於計算領域的細分市場。
由於超大規模的模型很難完全放進GPU內存,如果存儲在系統內存,訪問速度則會大大受限,Grace的問世主要即是為了解決這一瓶頸,具體有以下三點創新進步:
(1)內置下一代Arm Neoverse內核,每個CPU能在SPECrate2017_int_base基準測試中分數超過300分;
(2)採用第四代NVIDIA NVLink,從CPU到GPU連接速度超過900GB/s,達到相當於目前服務器14倍的帶寬;從CPU到CPU的速度超過600GB/s;
(3)擁有最高的內存帶寬,採用的新內存LPDDR5x技術,帶寬是LPDDR4的兩倍,能源效率提高了10倍,能提供更多計算能力。
總的來説Grace並不會很快出現在個人PC上,因為NVIDIA將其作為用於AI超級計算機和自然語言處理等超大數據量的數據中心CPU。不過瑞士國家超級計算機中心 (CSCS) 和美國能源部洛斯阿拉莫斯國家實驗室 (Los Alamos National Laboratory) 已經率先宣佈計劃構建搭載Grace的超級計算機,以支持國家科學研究工作。
不過極果君認為這是CPU自誕生以來被黑的最慘的一次,因為這個Grace架構完全是為了GPU服務的。CPU 的存在就是讓GPU隨心所欲訪問內存, 佔用系統資源, 針對的也是dl的工作量, 只能説在當下是一個極限的DNN煉丹機器。不過一般的數據中心也不需要這麼高的並行度,看起來並不會對 Intel Xeon造成太大威脅。
有的網友也開始調侃老黃髮布了一款“空氣CPU”,和RTX 30系顯卡因為買不到而被叫做“空氣”不一樣,這款Grace正式發佈時間在2年後,什麼整數浮點運算性能、主頻參數統統沒有,連製程工藝也語焉不詳。NVIDIA只在發佈會上透露,Grace在SPECrate2017_int_base基準測試中超過300分,可以與AMD第二代64核EPYC中的某些CPU相媲美。再看看這一個月裏AMD和Intel發佈的服務器GPU那一大串參數,這不就是“空氣”嗎!
不過什麼參數都沒有,唯一參數也只和AMD上一代ETPC持平,老黃為何敢拍着胸脯説Grace比其他x86架構強10倍呢?這就跟上文提到的數據傳輸有關了,因為,在數據傳輸速度這件事上,Grace比AMD和Intel跑得快多了。
未來計算的三大支柱盡收囊中黃仁勳還説道:“我們的數據中心產品線將由3種芯片組成:CPU、GPU、DPU,每款芯片將打造兩年,一年專注x86平台,一年則專注Arm平台 ,每一年都會推出令人興奮的產品,NVIDIA架構平台將同時支持x86跟Arm,無論客户要什麼我們都能滿足。”
原本NVIDIA的GPU起初為遊戲與視頻設計,但近年來成為開發AI應用不可或缺的基礎設施。黃仁勳更是已將目光放到了整個數據中心市場上,去年,NVIDIA宣佈推出DPU(數據處理器),接管數據中心的更多任務。
大會上推出的全新BlueField-3 DPU包含220億個晶體管,採用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,並完全向下兼容BlueField-2。
BlueField-2能夠負載相當於30個CPU核的工作,而BlueField-3實現了10倍的加速計算性能提升,能夠替代300個CPU核,以400Gbps的速率,對網絡流量進行保護、卸載和加速。該處理器也是首款支持第五代PCIe總線並提供數據中心時間同步加速的DPU。
新一代BlueField-3 DPU預計將於2022年第一季度發佈樣品。這樣下來,作為GPU霸主的NVIDIA發佈首款CPU之後,也宣告着他們集齊了數據中心產品線CPU、GPU、DPU這“未來計算的三大支柱”。
如何看待NVIDIA的全家桶?NVIDIA這波是“小孩子才做選擇,我全都要!”雖然本質上沒有芯片級的原創,但是在組合上,做出了新的夾心蛋糕,感覺會符合大佬們新的口味。
總體來看,NVIDIA的優勢在於,通過GPU+CPU+DPU的產品組合,能夠最大程度維持其在AI領域優勢,加上軟件和系統的優化,更好地滿足新興應用的需求,在新的市場佔據領導力,而非與競爭對手搶奪已有的市場。
所以現在對於老黃來説,簡直是不可多得的發佈服務器CPU和AI解決方案的時機,我們可以等過兩年看看成品,拭目以待事態進展。