首部東數西算白皮書發佈!什麼數據適合“西算”?

智東西(公眾號:zhidxcom)

作者 | 李水青

編輯 | 漠影

今年2月,國家發改委等多部門印發通知,建設10大國家數據中心集羣,全面啓動“東數西算”工程。這一項目意在用西部算力支持東部數字經濟,同時拉動西部發展,截至今年4月已帶動1900億元新項目。

近幾個月來,算力、網絡一直是東數西算工程中的話題焦點。但本週,由知名機構中國智算產業聯盟牽頭髮布的《東數西算下新型算力基礎設施發展白皮書》(簡稱:白皮書)傳遞出一個新觀點——海量温冷數據的“東數西存”或許才是首要課題,引起產業的廣泛關注。

近日,智東西與中科曙光存儲事業部副總經理張新鳳線上通話,就這一話題進行了深入探討。中科曙光是東數西算工程的重要參與者,目前已在成都、重慶等重要算力樞紐佈局了智算中心等算力設施。

首部東數西算白皮書發佈!什麼數據適合“西算”?

中科曙光存儲事業部副總經理張新鳳

一、温冷數據佔95%,“東數西存”引關注

作為國內首部關於東數西算智能算力設施的產業白皮書,報告指出:佔據數據總量95%的温冷數據更適合“西算”。所謂温冷數據,簡單來説,是指代對實時性要求較低的數據。這一説法明確回答了“什麼數據適合‘西算’”的關鍵問題。

首部東數西算白皮書發佈!什麼數據適合“西算”?

我們知道,在信息傳輸中,無論網絡帶寬多大,傳輸時延都是客觀存在的。因此,在 “東數西算”中,需要被計算節點頻繁訪問、網絡時延要求高的實時在線類 “熱數據” 不適合 “西算”,而離線類訪問頻率低、網絡時延要求不高的“冷數據”,以及介於兩者之間的“温數據”,更適合“西算”。

張新鳳告訴智東西,佔據數據總量的95%温冷數據對存儲的需求凸顯,要求東數西算注意算力和存儲的協同發展。在實際應用中,一些重計算的應用場景將算力排在第一位,以存儲輔助支撐;但有不少用户以數據密集型應用為需求,存儲佔比在數據中心中會更大。

作為東數西算的子場景,東數西存需求日益引起關注。張新鳳看到,存儲產業已經被東數西算工程帶動。

從曙光存儲自身來説,其今年已參與了多個相關項目;在這個過程中,團隊看到了用户對於更大存儲容量的需求,已從100PB規模發展到300~500PB。

當下,東數西算工程更強調應用的場景化。根據白皮書,温冷數據的“東數西存”,以及更細分場景,比如視頻遊戲應用所需的 “東數西渲”、AI模型訓練所需的“東數西訓”等,對存儲、算力要求高,但對數據實效性要求不高的應用場景,都將成為“東數西算”未來應用的重要支點。

實際點説,東數西算更關注供需關係。通過對東西部算力、存力等資源供需關係的合理匹配,讓“東數西算”融入到各個實際業務場景中,尤為重要。

而“東數西存”“東數西渲”“東數西訓”等應用場景,是推動“東數西算”均衡發展的有效途徑。

二、東數西算駛入快車道,存儲面臨四大轉型需求

將算力資源提升到水、電、燃氣等基礎資源的高度,進行跨區域調配,東數西算倡導的戰略價值已被各界認同。地方和產業龍頭都採取了行動,表現在成果上,根據工信部數據,截至今年4月東數西算已帶動1900億元新項目,預計到年底這一數據可能達到4000億元。

根據白皮書,“東數西算”工程的啓動實施,將直接拉動新一輪數據中心建設投資,自2022年以來,全國10個數據中心集羣中,新開工項目達到25個,新增數據中心規模達54萬標準機架。通用、智算、邊緣算力節點正在連成“算力一張網”。

張新鳳説,東數西算已進入了快速落地的階段,更豐富的適配場景和更細化、更系統的關鍵技術的評價指標,都加速了東數西算落地可行性。與此同時,東數西算也對數據中心提出了新的要求。具體到存儲層面,張新鳳談到了以下幾點:

1、東數西算中CPU、GPU等結合的異構計算較多,對存儲要求高。如何打通數據高速共享,提升性能效率,是需要解決的首要問題。

2、容器、雲原生等眾多新技術及應用落地東數西算,對存儲協議提出多樣化需求,要求存儲供應商提前做好技術佈局和支持。

3、作為國家工程,東數西算更強調數據安全,需要存儲系統從軟、硬件等多個層面上做好國產化等全方位考慮。

4、東數西算對於PUE值要求的比較高,怎麼保證存儲系統綠色低碳,市面上的產品和廠家還比較少。

這些需求結合起來,實際上為企業入場東數西存設置了不小的門檻。而突破這些門檻,也成為了東數西算駛入快車道需要跨越的技術圍欄。如果不跨越這些圍欄,必將影響東數西算設施在後續規模化落地應用中發揮應有作用。

三、從10PB到300PB,曙光提早佈局東數西存

曙光自2009年推出第一代分佈式存儲系統ParaStor以來,至今仍是國內為數不多掌握底層技術、實現代碼級開發與優化的分佈式存儲系統廠商。

張新鳳告訴智東西,經過超10年迭代,ParaStor單套規模已從16PB升級到100PB、300PB的超大項目。要知道,對於存儲系統來説這是一個質變的過程。它需要支持數百存儲節點、數千計算節點的部署,還要打破網絡架構的瓶頸。也正是一次次這樣的突破,讓客户認可了曙光存儲深厚的技術功底。

作為東數西算項目中重要參與者,曙光存儲從四大新需求切入,支持東數西算工程算力和存儲的協調、創新發展。

曙光ParaStor單一存儲節點同時支持文件、塊、對象、HDFS四種存儲服務,實現海量異構數據統一納管,提升異構計算存儲的性能效率,滿足東數西算中人工智能、雲計算、容器還有云原生等技術需求。

曙光存儲通過代碼級開發與優化,從部件、網絡、節點、數據冗餘等各層面保證數據的安全性及系統的穩健性,滿足東數西算工程對海量存儲的更高安全性級別的要求。

談及綠色低碳發展,張新鳳説,曙光正在把多年來積累的節能技術,從算力延展到存儲上,並將發佈業內首款液冷存儲系統。未來將與計算節點形成一體化解決方案,幫助數據中心獲得更高節能等級,實現更低的PUE值的目標。

根據白皮書,以西部(重慶)科學城先進數據中心為例,其採用了浸沒液冷技術、餘熱回收、綠色建築、清潔能源(光伏)等多種相關技術,使得項目年均PUE可達到1.144,年節省用電約為14624.8 MWh,年節省標準煤4870噸,年減少二氧化碳排放13149噸。

在談到對東數西算智能化場景的應用支持時,張新鳳説,以自動駕駛為例,從L1到L5階段產生的數據量達百倍增長,其中大多是對温冷數據的進一步處理,從而實現研發速度、模型精度的提升。曙光一方面提供多種協議支持,滿足自動駕駛數據在採集、存儲、處理、分析等不同流程應用需求;一方面通過精細化的權限控制,保障數據存取安全和訪問合規。

可以看到,隨着東數西算駛入快車道,實際應用場景和客户需求正呼喚存儲產業進行迭代,以曙光為代表的產業玩家已拿出看家本領,並吃到新的產業紅利。

結語:東數西存,“全國算力一張網”建設的預備關

當下,東數西算成為支持數字經濟發展的重要舉措。根據中國信通院發佈的數據,在算力中每投入1元,將帶動3-4元經濟產出;算力發展指數每提高1點,GDP增長約1293億元。

值得一提的是,東數西算中的“算”非常重要,但“存”也應該被同等重視。東數西算對當下的存儲產業提出了綠色、創新、安全等多方面新要求,關係到“算力一張網”建設大局。這為存儲產業玩家帶來了新挑戰,也帶來了新的市場空間。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2875 字。

轉載請註明: 首部東數西算白皮書發佈!什麼數據適合“西算”? - 楠木軒