E級超算元年將至,中國三條技術路線衝頂

人類歷史經歷了農業、工業和信息革命,現在正處於人工智能革命的進程之中。

對此,中國計算機學會高性能計算專業委員會秘書長,中科院計算所研究員張雲泉博士在接受 DeepTech 採訪時表示:“農業社會靠體力,工業社會靠機器,信息社會靠互聯網,而人工智能社會要靠 ‘算力’,誰能佔領 ‘算力’ 的制高點,誰就有了引領社會發展的基礎。”

因此,代表算力巔峯的 “超級計算機” 就顯得至關重要。

上月,最新的全球超級計算機 TOP500 發佈,榜單顯示有高達 45.2% 的計算機來自中國,且中國超算佔全球在榜總算力的 25.6%。

在我們為此高興的同時,日本超級計算機 “富嶽”(Fugaku)首次上榜即榮登榜首的消息,也讓不少國人感到了壓力,認為中國超算又落後於人,可事實真的如此嗎?

張雲泉向 DeepTech 作出瞭如下結論:富嶽以半 E 級(算力 > 1000 PFlops)超算的未完成形態衝榜,旨在打中美 E 級超算一個時間差,短期成為 “獨孤求敗”,但等到年底或明年,中美超算一出,就會變成 “獨孤必敗”。

2021 年是業內公認的 E 級超算元年,中國已有神威、天河 3 號、曙光三條不同技術路線的 E 級原型機交付,如今正向頂峯進擊。

榜單上的中國

中國超算的起步並不算晚,有這樣一個 “玻璃房子” 的故事一直被人們提起。

上世紀 80 年代,中國石油工業部物探局曾重金購買了一台 IBM 大型機,但這筆交易的附加條件非常苛刻。

首先,為防止中方 “竊取技術”,美方將該主機安置在一間玻璃房內,對其實施了 24 小時全方位監控,且進出鑰匙交由美方控制;其次,機器的啓動密碼也由美方掌握,並且規定中方應定期向美國提交系統日誌。

中國超級計算機的先驅們,就在這樣的環境下揚起了風帆。

1983 年 12 月,我國第一台每秒鐘運算超 1 億次的計算機——“銀河” 研製成功,這一成果使中國成為繼美國、日本之後,第三個能獨立設計和研製超級計算機的國家。

E級超算元年將至,中國三條技術路線衝頂

圖 | 銀河 1 號

此後,“銀河 2 號”、“銀河 3 號”、“銀河 4 號” 接踵而來,算力從也每秒 1 億次上升到 1 萬億次。自此,中國成為少數能發佈 5 至 7 天中期數值天氣預報的國家之一。

1992 年,中國研製成功 “曙光 1 號” 超級計算機,開闢了另一序列。

後來,由於大規模並行計算機代替向量機成為重點發展方向,中國開始研發 “神威” 系列超級計算機,並於 1999 年推出了神威 1 號。另外,2002 年聯想集團也推出了名為 “深騰” 的機羣並行機。

至此,中國最重要的四個超算系列都登上了歷史舞台。

E級超算元年將至,中國三條技術路線衝頂

圖 | 中國超算數量變化圖

2005 年,中國超算算力突破 10 萬億次/秒;2010 年,“天河 1 號 A”代表中國第一次登上了全球超級計算機榜首,但優勢地位轉瞬即逝,被日本超算 “京” 取代。

2013 年 6 月到 2018 年 6 月,“天河 2 號”、“神威·太湖之光” 連續雄踞 TOP500 榜首長達 5 年。此後,美國超算 Summit 奪魁,神威一直處於榜單前三的位置,直到上個月富嶽的出現。

在近 40 年的發展歷程中,中國在美國不斷施壓、禁運、技術封鎖的外部條件下,研製成功了多台以神威為代表的核心部件全部國產化的超算,目前,中國所有的上榜超算中,已經完全看不到 IBM 的身影。

那麼我國的超算在世界範圍內處在一個怎樣的位置呢?通過對 TOP500 榜單的進一步分析或許能有一個直觀的瞭解。

E級超算元年將至,中國三條技術路線衝頂

圖 | TOP500 國家-數量 餅圖

E級超算元年將至,中國三條技術路線衝頂

圖 | TOP500 國家-算力 餅圖

所以,在短期內,超算領域將是中美兩強領先的戰場,不太可能有其他國家參與的機會。

E級超算元年將至,中國三條技術路線衝頂

圖 | TOP500 供應商-數量 餅圖

E級超算元年將至,中國三條技術路線衝頂

圖 | TOP500 供應商-算力 餅圖

再看供應商的分佈圖,聯想、曙光、浪潮三家頭部供應商製造了 62.4% 的超算設備,提供了 26.8% 的算力。

數量佔比和算力佔比差距比較大,這一方面反映我國的超算製造業份額雖然佔優(TOP500 中 321 台設備為中國製造),但總體上單台超算性能比不上美國和日本,即使這兩個國家分別只有 113 台和 29 台設備在榜。

查看 TOP500 中國區榜單可以看到,除了神威·太湖之光和天河 2A 分別排名第 4、5 名比較靠前之外,前 100 名超算設備中國僅佔 6 台。這足以説明我國超算設備整體仍處於中低水平,發展不夠均衡。

所以,我國在超算領域,無疑是“超算大國”,但和“超算強國”仍有一定距離,後續應該着重發展質量,而非數量。

“未完成” 的富嶽

富嶽,是日本最高峯富士山的別稱,可見其締造者寄予的厚望,而它也確實不負所托。

作為“京”的後繼機型,富嶽於 2014 年起繼續由富士通與日本理化學研究所共同開發,部署在兵庫縣神户市中央區港灣人工島上的理化學研究所計算科學研究中心內,本預計於 2021 年正式運行,如今它的提早到來,也讓我們有機會一睹真容。

E級超算元年將至,中國三條技術路線衝頂

這是一台由接近 730 萬 CPU核心,4.87 PB 內存組成的超級計算機,值得注意的是,它所搭載的富士通自研 A64FX CPU(48+4 core)採用了超算罕有,而智能手機設備常用的 ARM 架構設計開發,這在 TOP500 冠軍中史無前例。

作為半 E 級超級計算機,富嶽的性能的確非常強悍。

在 7nm 製程、高帶寬存儲、“豆腐-D”互連的共同加持下,常規 Linpack 測試結果達到 415.53 PFlops(千萬億次浮點運算每秒),在業界普遍認為更接近實際應用場景的 HPCG(高性能共軛梯度基準測試)中更是達到了 13.37 PFlops,這個數字相較中國及美國的在榜超算都有一個不小的提升。

然而算力的提升並非沒有代價。

E級超算元年將至,中國三條技術路線衝頂

由圖可見,中國的神威超算於 2016 年 6 月首次上榜,而富嶽則是 2020 年 6 月上榜,間隔了 4 年時間。

對於計算機來説,4 年是個很長的時間。

摩爾定律告訴我們,集成電路上可容納的晶體管數目,約每隔兩年便會增加一倍;雖然實際這個定律走得時快時慢,但總體的趨勢和量級還是非常準確的。

E級超算元年將至,中國三條技術路線衝頂

圖 | 全球主要晶圓廠製程演化圖

據報道,“神威”項目於 2012 年 7 月進行項目調研,2014 年 3 月科技部正式立項,2015 年 12 月 31 日主機研製成功,2016 年 6 月登上 TOP500 榜首,雖然沒有對外公佈具體制程,但外界推測,其很可能採用了中芯國際的 28nm 製程工藝。反觀富嶽這邊,官方公佈其採用的是台積電 7nm 的最新技術。

這個差距有多大呢?

大概是從 iPhone5S(28nm)到 iPhone XS(7nm)之間的差距。DeepTech 根據台積電官網對製程的描述整理瞭如下圖片。

E級超算元年將至,中國三條技術路線衝頂

圖 | 台積電芯片製程信息圖

可以看到,隨着製程的降低,芯片的運行速度不斷提升,能耗大幅降低。雖然台積電的數據並非絕對,但每一層較下層動輒 15% 的效能提升還是讓人為之驚歎。

除了芯片製程上的代差,在內存方面富嶽的可選項也明顯優於神威。

據官方資料顯示,富嶽採用的是名為 HBM2 的高帶寬存儲器,每個芯片的內存帶寬高達 1024 GB/s。而神威則採用的是四通道 DDR3-2133 存儲器,連 DDR4 都不是,每個芯片總帶寬僅為 136.5 GB/s,不足富嶽的七分之一。

假如神威也能夠使用 7nm 製程的芯片和 HBM2 的內存,再與富嶽同台競技,那麼究竟誰更勝一籌可能要打個大大的問號。

雖然富嶽在先天條件上佔盡優勢,但作為衝擊 E 級超算的種子選手,其能耗上的表現卻算不得優秀。

根據官方數據,在 Linpack 測試中,排名第一的富嶽每兆瓦提供的算力為 14.67 PFlops,而排名第二的 Summit 每兆瓦提供的算力為 14.72 PFlops,幾乎相差無幾,而如果要達到 E 級算力,富嶽在現有體系下的理論能耗將超過 68 兆瓦。

這是一個不可接受的數字,業內普遍認為這個數字應該在 40 兆瓦以下,而 E 級超算之所以遲遲未出,能耗過高是一個很關鍵的瓶頸因素。

值得玩味的是,本來 ARM 架構的芯片素來以低能耗、低發熱著稱,但即便有 7nm 最先進製程工藝加持,富嶽在能耗方面依舊沒有體現出任何優勢,這一點非常值得學者們深究。

E級超算元年將至,中國三條技術路線衝頂

圖 | 富嶽 Fujitsu A64FX CPU (48+4 core)

最後,富嶽還面臨着製造成本過於高昂的問題。

據日本理研計算科學中心負責人松崗聰透露,“富嶽” 的造價約為 10 億美元,約合 70 億元人民幣。與此同時,排名第二的美國超算 Summit 造價為 2 億美元,排名第四的神威造價為 2.73 億美元。

據外界估算,富嶽採用的 HBM2 內存每個 G 的報價大概在 9-16 美元,因此僅內存一項的成本就在 4300 萬美元到 7700 萬美元之間。

雖然富嶽的算力目前大幅領先,但如果對應的造價也成倍增長的話,就失去了競爭的意義。

畢竟,即便是以神威的技術體系,砸錢將算力衝到 E 級也是完全能夠做到的,但假如這樣,又有什麼樂趣呢?

中國超算的應用

超算,被稱作 “國之重器”。

發展至今,超算已經廣泛應用在密碼研究、核爆模擬、武器研製、氣象氣候、石油勘探、海洋環境、航空航天、宇宙模擬、材料科學、工業設計、地震模擬、人工智能、深度學習、生物醫藥、基因工程、動漫渲染、過程控制、數據挖掘、金融分析、公共服務等等領域,以及各種 “高、精、尖” 的前沿科學中。

發展超算不僅是各國綜合國力在科技方面的體現,更是解決國家經濟建設、社會發展、科學進步、國家安全和國防建設等領域一系列重大挑戰性問題的重要手段。

E級超算元年將至,中國三條技術路線衝頂

圖 | 中國 HPC TOP100 行業應用領域

然而超算相關生態的培養並非一朝一夕能夠完成。曾幾何時,天河 1 號超算工程被曝閒置 1 年,天河 2 號落成後,算力使用長期處於較低水平。

張雲泉對 DeepTech 介紹道,目前中國主流的幾個超算中心算力利用率已經達到 60%-70% 左右,基本處於較理想工作狀態。

但他繼續説道,現階段我國的超算軟件發展相對滯後,商業軟件方面基本屬於空白,少有的幾款較知名自研軟件,在功能和穩定性上也還有所欠缺。想要快速發展,一定要轉變思想,加大超算經費投入中軟件的佔比,力爭最終達到軟硬件 1:1 的目標。

“最近國產超算軟件在並行優化方面進步不少,以往的軟件大都只能同時使用幾千到幾萬個核心,大量的核心被閒置無法利用,而現在已經有七八款軟件能夠調用‘神威·太湖之光’全機,十幾款軟件能夠調用半機”。張雲泉強調,這種優化對科研工作非常重要,往往能夠將計算結果所需時間進行數量級級別的縮短。

DeepTech 特地在中國國家網格官網上查看,其列出的軟件包含商業軟件 8 款(排除神威系統編譯器),開源軟件 31 款(無一明確標註為國人開發),而國產自研軟件僅 4 款。

中國的確在超算軟件領域任重道遠,不過也不必過於悲觀,自 2016 年中國團隊摘得超算軟件設計“戈登·貝爾”獎桂冠,實現零的突破開始,中國前進的腳步只會越走越快。

奔向 E 級

E 級超算已經成為世界各國在超算領域競逐的明確目標。

美國能源部(Department of Energy)已推出 ECP 計劃,投入 18 億美元研製 3 台 E 級超級計算機,另外 18 億美元研發超算應用。預計 2021 年上半年將正式完成第一台的開發。

日本富嶽自不必説,年底或明年初一定會將剩餘的算力補足,到時候以全新面貌再次出現。

中國這邊,神威、天河3號、曙光的三個不同技術路線的 E 級原型機均於 2018 年完成了交付。

曙光總裁厲軍在接受《財經天下週刊》採訪時曾表示,這三台超算背後的團隊都很厲害,且各有所長。

神威背後的江南計算所有很好的 CPU 技術,其他方面的國產化也做得很好;天河背後的國防科技大學有很好的網絡技術,在自主高性能互聯網絡方面非常獨到;曙光則有很好的應用架構設計能力、工程設計能力,並且曙光作為上市公司,在商業化方面做得最好。

2021年註定成為 E 級超算元年,不論哪方將榜一的桂冠斬落,亦或有黑馬出現,都值得期待。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 5006 字。

轉載請註明: E級超算元年將至,中國三條技術路線衝頂 - 楠木軒