楠木軒

扒一扒中國超算榜單裏的“黑馬”

由 伯國平 發佈於 科技

Linpack測試性能達3.743PFlops,峯值性能達7.035PFlops。

在近日公佈的2020中國高性能計算機性能排行榜Top 100中,北京超級雲計算中心無疑是最令人矚目的那一個。

這是因為榜單的前2位已經五年沒有發生更迭,還是熟悉的兩個——“神威太湖之光”和“天河二號A”,而榜單的第3位,也就是北京超級雲計算中心,則是異軍突起的新面孔。

今天,我們就來深扒北京超級雲計算中心背後的故事。

“王謝堂前燕

飛入尋常百姓家”

在大家的印象裏,超算往往都是大傢伙、重武器,是用於研究核能聚變、宇宙、氣候等國家級課題的“國之重器”。其實,在“國民經濟主戰場”,更多的應用是無法企及國之重器這樣的高度的,這就要求超算不能只是“王謝堂前燕”,還要“飛入尋常百姓家”。

簡單來説,目前超算行業正在形成三類市場:

第一類,尖端超算,需要國家集中力量辦大事,打造最尖端的超算中心;

第二類,通用超算,需要性價比高的解決方案,超級雲計算中心的模式對推動超算商業化具有重大的作用;

第三類,行業超算,需要根據業務需求設計上雲流程,提供行業定製。

而北京超級雲計算中心(A分區),就屬於不折不扣的、服務千行百業的通用超算。通過“雲化”的超算服務模式,服務於對算力不同需求的科研用户,同時也為國家超算提供給了重要的算力補充。

據瞭解,北京超級雲計算中心成立於2011年,依託中國科學院計算機網絡信息中心建立,由北京北龍超級雲計算有限責任公司負責運營,是懷柔科學城北京市人民政府與中國科學院共同建設的重點項目。本次奪得第3名的北京超級雲計算中心A分區,是中心現有資源池的一部分。為滿足不同用户對計算的使用和資源存儲需求,中心還有T分區、M分區、IO分區以及科技雲9分區等。

成立9年的超算中心

衝擊超算榜單靠的是什麼?

榜單發佈人、中國科學院計算技術研究所研究員張雲泉介紹,2020年共計提交73台新系統,根據TOP100排行規則,排重合並後新增機器上榜47台,這也意味着,2019年榜單中的100台系統僅剩餘53台,淘汰率接近50%,競爭程度之激烈可見一斑。

那麼,一家成立9年的超算中心,靠的什麼一舉斬獲2020中國HPC榜單第三呢?

顯然,這和技術的升級迭代脱離不了關係。

2019年8月,AMD發佈了全球首顆7nm製程工藝,代號為“羅馬”的第二代AMD EPYC霄龍系列處理器。在架構方面,新一代AMD Infinity架構突破了x86性能和計算能力,獲得了同類產品最高的I/O和內存帶寬,在多種工作負載下最高能夠將總體擁有成本(TCO) 降低50%。

而北京超級雲計算中心正是敏鋭地把握住了技術創新的趨勢。3個月後的同年11月,北京超級雲計算中心選擇戴爾科技為設備供應方,採用第二代AMD EPYC 處理器的A分區迅速正式上線了100個節點,截至2020年10月已逐步擴容到3000節點,從而實現算力的大跨越。

迎來黃金期的超算

戴爾科技助力前行

近年來,隨着國內移動互聯網快速發展,越來越多企業對強大算力的需求持續升温,這也給中國超算的發展帶來了黃金期。

統計數據顯示,截至2019年,我國傳統超算市場的整體規模達280億元,其中尖端超算目前大約佔四分之一,而通用超算佔四分之三。但目前來看,超算主要是尖端超級計算機及其用户,中小用户和麪向行業的業務型用户的需求沒有得到滿足。

北京超級雲計算中心聚焦通用計算市場,以隨需供應的“超級雲計算服務”的模式向用户提供算力,面向海量無超算資源的用户以及中小微超算用户,無疑為超算的商業化發展探索出一條新路線。

還需指出的是,“計算”作為一種支撐和工具,它只是先進生產力鏈條中的一個環節。在計算之外,數據的採集與處理、軟件的設計與調優、模型模式的開發等等,同樣重要。

在這方面,戴爾科技作為全球領先的IT端到端解決方案提供商,不僅為像北京超級雲計算中心這樣的客户提供全面的HPC就緒方案和HPC產品方案,同時也在軟件應用等方面,幫助客户用好超算,釋放超算的更大潛力。

坐落於著名學府劍橋大學的“Cumulus–英國科學雲”是英國最大的學術超級計算機,由戴爾科技為其提供算力支持,性能可達每秒超過2千萬億次浮點運算。

除了算力支持外,戴爾科技還聯合合作伙伴開發了戴爾數據加速器(Dell Data Accelerator:DAC),通過基於NVMe的存儲解決方案,消除了拖慢系統性能的存儲瓶頸,實現了HPC系統中新一代的數據密集型工作流程。

在2019年6月Virtual Institute公佈的2019 I/O-500榜單中,集成了DAC的Cumulus以620.69的得分位列第一,領先第二名290分!這意味着它首次亮相即是世界上最快的HPC存儲系統,比第二名的性能提高了近一倍。

並且,戴爾科技通過經工程驗證的系統配置(包括DAC服務器節點,內存,網絡,PCIe存儲和NVMe存儲),已向廣大HPC用户提供該解決方案,從而共享DAC的優勢。這意味着DAC提供了全球最快的開源NVMe存儲解決方案之一。

可以看見,戴爾科技能為HPC用户提供的,絕不僅僅是算力這麼簡單。事實上,憑藉多年的創新與開放,戴爾科技已經形成了完整的生態系統,可以為客户提供從HPC的採購到部署、從應用到運維的全生命週期管理服務,釋放超算的強大潛力,讓客户將精力真正投入到業務當中。