傳統確定一個蛋白質結構,通常需要幾個月甚至是幾年,過去半個多世紀人類共解析了五萬多個人源蛋白質的解構,但是基於深層神經網絡的AlphaFold僅用一年時間就將結構信息預測比例從17%大幅提高到58%。
在交通領域,數字世界和物理世界走向融合,未來城市每輛車的具體位置、每個路口有多少輛車、車移動的方向等都能用全量實時數據進行感知和調整,每年可為一座千萬級人口的城市節約1500億元,避免94%的人為交通事故,提升通行效率15-30%……
這些超乎想象的事實背後,都有同一個身影:智慧計算。《2021-2022全球計算力指數評估報告》顯示,算力指數平均每提高1點,數字經濟和GDP將分別增長3.5‰和1.8‰,當一個國家的算力指數達到40分、60分時,計算力對於GDP增長的推動力將增加1.5倍和3.0倍。
智算正在以蓬勃的創造力帶來磅礴的推動力。
這是浪潮信息生態夥伴大會IPF這幾年持續聚焦“智算”的原因所在。今年的IPF2022給人以耳目一新的感覺,正如其主題:“智算創見 數實相融”。智算從看見到創見,推動數字世界與物理世界從相聯到相融。
算力算法“基建化”的底層邏輯“智算要想真正迸發出創造力,就需要算力算法基建化,即國家將算力、算法做成公共資源開放出來。” 浪潮信息CEO彭震在接受採訪時這樣説。
算力基建化,已經得到了業界的廣泛認可,而且推進迅速。在國家統籌佈局下,全國性的算力樞紐工程開始建設,最近資本市場上炙手可熱的“東數西算”就是如此。算力基建化,正在發揮越來越重要的作用。以浪潮建設的南京智算中心為例,運行一年多的時間,算力規模相當於1個小時內可以完成100億張圖像處理、300萬小時語音翻譯、1萬公里自動駕駛數據處理,現已服務55家用户單位,覆蓋了包括智能製造、氣象檢測和智慧交通等13個行業。
然而,為何算法也需要基建化?一方面是源自行業的進化,算法正在從專用算法走向通用算法。以前人們對神經元計算的認知比較淺,自然語義理解、文本識別、語言翻譯、問答對話等不同應用場景採用專用算法效率更高,但是隨着高泛化能力和高通用性的大模型的出現,無監督學習也使得開發者在模型訓練初期基於高質量的數據,讓AI可以自動做數據標識和訓練,一個模型可以覆蓋眾多場景。
另一方面是源自AI落地的痛點,這幾年AI很熱,但在落地的最後一公里上卻遇到難題,歸根結底是高昂的開發成本和技術門檻,數據的收集、標註和訓練耗時耗力、複雜繁瑣,相比起來,大模型催生出“預訓練大模型+下游任務微調”這樣更高效、簡單的新模式,算法進入工業化時代。
在這樣的背景下,算法大模型就成為類似智算中心那樣的新基建。以浪潮發佈的全球最大規模中文人工智能巨量模型“源”為例,單體模型參數量達2457億,訓練採用的中文數據集達5000GB,“源1.0”上線不到5個月的時間,就已有超過200家單位試用,支持了100多個行業應用。
“今時四宇求新,於赫有智,智隆於算。構基建為本,利之以芯,範之以理,修之以智。革新憑其威,技藝信其敏。感世事之大千兮,未嘗有極。識倏忽之人情兮,安有常則?故內引智算於先,外察淵慧於勢。智能為爐兮,元腦為工,算力為炭兮,數據為銅。匯引眾力,則無懼關山難越。聚用眾智,則敢為智算之先。” 很難想象這段精闢解析智算的詩是“源1.0”所作,機器智能正在媲美於人。
算力算法基建化,不僅可行,而且可能。
智算新基建的三張面孔然而,理想很美好,現實很骨感。算力算法基建化,也遇到了算力供給與需求矛盾突出,算法的多樣性、專業性和巨量化難題,能耗高企,以及生態割裂等四大挑戰。
或者換句話,算力算法的新基建並不只是集中建設那麼簡單,它的“新”要求其至少有三張新的面孔:一個普惠的新基建,一個綠色的新基建,一個能夠用起來的新基建。
一個普惠的新基建,要破解的就是業界對算力指數級增長的需求與通用CPU芯片算力供給無法匹配的矛盾,以及算法大模型高昂的成本和技術複雜度帶來的挑戰。破局的關鍵在於技術,在IPF2022上,浪潮的融合架構升級到了3.0,以數據為中心的計算架構,實現節點內存共享、跨節點級加速器共享。同時,浪潮不斷強化大模型算法的升級,目前正在從單模態、自監督學習為特徵的第二階段進化到多模態、自監督學習為特徵的第三階段,未來更是升級到物理世界交互式的超模態主動學習階段。這一切都讓普惠的算力和算法成為可能。
一個綠色的新基建,破解的就是數據中心在能耗上的巨大壓力。數據預測,2033年數據中心能耗將達2600億千瓦時,2030年數據中心用電量高達4000億千瓦時。顯然,如此高耗能的數據中心,不是稱職的新基建。在這次大會,浪潮高舉液冷大旗,聯合京東發佈天樞(ORS3000S)液冷整機櫃服務器,PUE低至1.1,而亞洲最大的液冷數據中心研發生產基地——天池,更是在業界首次實現冷板式液冷整機櫃的大批量交付,年產量10萬台,幫助數據中心PUE降到1.1以下。
如此重磅的消息發佈,令人吃驚,只能説明一點:浪潮認為液冷的爆發點來了。對此,彭震表示,過去五年浪潮一直在探索液冷,現在一方面是技術已經成熟,另一方面是國家對於綠色低碳的要求,這些匯聚到一起,就催生出液冷的爆發。
顯然,浪潮在液冷上的全棧式佈局,就是要將液冷變成一個更為廣泛使用的技術,實現大規模的普及。液冷不僅有看得見的收益(綠色低碳),更有“意外”的收穫。京東的相關人士透露,數據中心用了液冷之後,就幾乎不再需要風扇,帶來的變化是機器沒有了振動,機房變得非常安靜。更重要的是,沒有了振動後,硬盤磁頭的壽命將能實現大幅度提升,設備故障率大幅下降。
新基建“建”很重要,但歸根結底“用”起來才是關鍵。這也是浪潮花了很大精力構建元腦生態的原因所在。彭震説,元腦生態就是一個資源平台,聚合了眾多應用開發合作伙伴,以及各種各樣的算法,AIStore可以實現最新商機、熱點資訊、技術趨勢、AI方案的分享,而AIStation則是一個支撐和賦能平台,幫助企業迭代優化、不斷完善AI生產和賦能模式。
“從某種程度來説,元腦生態就是一個推動整個社會智慧化、數字化轉型的類組織化的存在,為大家創造一個展現自己、彼此連接、賦能助力的土壤。”彭震這樣説。
所以,算力算法新基建,不僅能建得好,還能用得好。
後記:智算如火,浪潮如水智算如火,這是我參加IPF2022的第一個印象。
回顧這幾年的IPF,從2015年的“計算+”到2016年的科學計算、關鍵計算、智慧計算的細分,再到2017年聚焦“智慧計算”,以及2019年提出“計算是生產力”、2020年提出“智算中心是新基建”,再到去年的“智算之道 築基創新”和今年的“智算創見 數實相融”,智算就如同星星之火,形成燎原之勢。
從看見智算的力量,到創見智算的價值,智算如火,驅動數實從相知、相戀走向相愛。正如清華大學全球產業研究院副院長李東紅所説,“算力相關產業發展加速推動‘數實融合’,為數字經濟發展提供核心支撐力和驅動力。”
這是數字化轉型步入深水區的必然選擇,如果説計算力改變的是生產力,那麼智算力帶來的則是創造力。彭震説,信息化更多的是將業務流程電子化,而現在則是用數字化描繪整個世界,這時候需要的就是算力+算法+數據三要素有機融合的智算。
浪潮如水,這是我的第二個印象。
彼得·德魯克曾説,“沒有人有能力預測未來,預測未來最好的辦法是創造它。” 浪潮,不僅看見了智算的未來,同時在創造這種未來。
正如其名,浪潮有着“水”的特質,在技術維度,是持續迭代,“滴水石穿”,對技術的進化路徑有着清晰的認識,一步一個腳印堅實前行,從融合架構的演進,和算法的不斷強化,以及液冷一鳴驚人背後的“寒窗苦讀”,和發佈國內首個元宇宙服務器MetaEngine都是這樣;在生態維度,是“水善利萬物而不爭”的初心,是“不積小流,無以成江海”的開放態度,不斷實現生態進階。
最終,是讓智算新基建夢想照進現實,算力就像“水”一樣即開即用,簡單而普惠。
1983年,阿爾温·托夫勒的《第三次浪潮》一書熱銷,該書提出“信息技術將成為社會發展的主要推動力”。也是這一年,山東一個只有幾百人的電子設備廠生產的第一台微機問世,開發者們為它起了一個響亮的名字:浪潮,後來公司的名字也改成了“浪潮”。這是浪潮公司的名字由來。
近四十年後的今天,推動數實相融的智算正在成為新的“浪潮”,而浪潮同樣站在“浪潮”之巔,讓“浪潮”加速。