扒一扒中國超算榜單裡的“黑馬”

Linpack測試效能達3.743PFlops,峰值效能達7.035PFlops。

在近日公佈的2020中國高效能計算機效能排行榜Top 100中,北京超級雲計算中心無疑是最令人矚目的那一個。

這是因為榜單的前2位已經五年沒有發生更迭,還是熟悉的兩個——“神威太湖之光”和“天河二號A”,而榜單的第3位,也就是北京超級雲計算中心,則是異軍突起的新面孔。

今天,我們就來深扒北京超級雲計算中心背後的故事。

“王謝堂前燕

飛入尋常百姓家”

在大家的印象裡,超算往往都是大傢伙、重武器,是用於研究核能聚變、宇宙、氣候等國家級課題的“國之重器”。其實,在“國民經濟主戰場”,更多的應用是無法企及國之重器這樣的高度的,這就要求超算不能只是“王謝堂前燕”,還要“飛入尋常百姓家”。

簡單來說,目前超算行業正在形成三類市場:

第一類,尖端超算,需要國家集中力量辦大事,打造最尖端的超算中心;

第二類,通用超算,需要價效比高的解決方案,超級雲計算中心的模式對推動超算商業化具有重大的作用;

第三類,行業超算,需要根據業務需求設計上雲流程,提供行業定製。

而北京超級雲計算中心(A分割槽),就屬於不折不扣的、服務千行百業的通用超算。透過“雲化”的超算服務模式,服務於對算力不同需求的科研使用者,同時也為國家超算提供給了重要的算力補充。

據瞭解,北京超級雲計算中心成立於2011年,依託中國科學院計算機網路資訊中心建立,由北京北龍超級雲計算有限責任公司負責運營,是懷柔科學城北京市人民政府與中國科學院共同建設的重點專案。本次奪得第3名的北京超級雲計算中心A分割槽,是中心現有資源池的一部分。為滿足不同使用者對計算的使用和資源儲存需求,中心還有T分割槽、M分割槽、IO分割槽以及科技雲9分割槽等。

扒一扒中國超算榜單裡的“黑馬”
成立9年的超算中心

衝擊超算榜單靠的是什麼?

榜單釋出人、中國科學院計算技術研究所研究員張雲泉介紹,2020年共計提交73臺新系統,根據TOP100排行規則,排重合並後新增機器上榜47臺,這也意味著,2019年榜單中的100臺系統僅剩餘53臺,淘汰率接近50%,競爭程度之激烈可見一斑。

那麼,一家成立9年的超算中心,靠的什麼一舉斬獲2020中國HPC榜單第三呢?

顯然,這和技術的升級迭代脫離不了關係。

2019年8月,AMD釋出了全球首顆7nm製程工藝,代號為“羅馬”的第二代AMD EPYC霄龍系列處理器。在架構方面,新一代AMD Infinity架構突破了x86效能和計算能力,獲得了同類產品最高的I/O和記憶體頻寬,在多種工作負載下最高能夠將總體擁有成本(TCO) 降低50%。

扒一扒中國超算榜單裡的“黑馬”
而北京超級雲計算中心正是敏銳地把握住了技術創新的趨勢。3個月後的同年11月,北京超級雲計算中心選擇戴爾科技為裝置供應方,採用第二代AMD EPYC 處理器的A分割槽迅速正式上線了100個節點,截至2020年10月已逐步擴容到3000節點,從而實現算力的大跨越。

迎來黃金期的超算

戴爾科技助力前行

近年來,隨著國內移動網際網路快速發展,越來越多企業對強大算力的需求持續升溫,這也給中國超算的發展帶來了黃金期。

統計資料顯示,截至2019年,我國傳統超算市場的整體規模達280億元,其中尖端超算目前大約佔四分之一,而通用超算佔四分之三。但目前來看,超算主要是尖端超級計算機及其使用者,中小使用者和麵向行業的業務型使用者的需求沒有得到滿足。

北京超級雲計算中心聚焦通用計算市場,以隨需供應的“超級雲計算服務”的模式向用戶提供算力,面向海量無超算資源的使用者以及中小微超算使用者,無疑為超算的商業化發展探索出一條新路線。

扒一扒中國超算榜單裡的“黑馬”
還需指出的是,“計算”作為一種支撐和工具,它只是先進生產力鏈條中的一個環節。在計算之外,資料的採集與處理、軟體的設計與調優、模型模式的開發等等,同樣重要。

在這方面,戴爾科技作為全球領先的IT端到端解決方案提供商,不僅為像北京超級雲計算中心這樣的客戶提供全面的HPC就緒方案和HPC產品方案,同時也在軟體應用等方面,幫助客戶用好超算,釋放超算的更大潛力。

扒一扒中國超算榜單裡的“黑馬”
坐落於著名學府劍橋大學的“Cumulus–英國科學雲”是英國最大的學術超級計算機,由戴爾科技為其提供算力支援,效能可達每秒超過2千萬億次浮點運算。

除了算力支援外,戴爾科技還聯合合作伙伴開發了戴爾資料加速器(Dell Data Accelerator:DAC),透過基於NVMe的儲存解決方案,消除了拖慢系統性能的儲存瓶頸,實現了HPC系統中新一代的資料密集型工作流程。

扒一扒中國超算榜單裡的“黑馬”
在2019年6月Virtual Institute公佈的2019 I/O-500榜單中,集成了DAC的Cumulus以620.69的得分位列第一,領先第二名290分!這意味著它首次亮相即是世界上最快的HPC儲存系統,比第二名的效能提高了近一倍。

並且,戴爾科技透過經工程驗證的系統配置(包括DAC伺服器節點,記憶體,網路,PCIe儲存和NVMe儲存),已向廣大HPC使用者提供該解決方案,從而共享DAC的優勢。這意味著DAC提供了全球最快的開源NVMe儲存解決方案之一。

扒一扒中國超算榜單裡的“黑馬”
可以看見,戴爾科技能為HPC使用者提供的,絕不僅僅是算力這麼簡單。事實上,憑藉多年的創新與開放,戴爾科技已經形成了完整的生態系統,可以為客戶提供從HPC的採購到部署、從應用到運維的全生命週期管理服務,釋放超算的強大潛力,讓客戶將精力真正投入到業務當中。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 2167 字。

轉載請註明: 扒一扒中國超算榜單裡的“黑馬” - 楠木軒