AI算力新地基能否解困算不起、算不動？

2021-03-26由頻長志發佈於科技

圖源：圖蟲

編者按：本文來自微信公眾號懂懂筆記（ID： dongdong_note），作者懂懂編輯秦言，創業邦經授權轉載。

最近，關於“兩個辛丑年對比”的話題刷屏朋友圈，在關於“國家實力與底氣”的討論中之外，懂懂也在關注軟實力方面中國力量的崛起，這就是科技實力的變化。

説到科技，我們首先會聯想到的就是5G、大數據、萬物互聯和人工智能等熱詞。不可否認的是，人工智能是這些新興信息技術中的“當紅炸子雞”，更是未來產業、社會甚至國力發展的“底氣”所在。

值得欣喜的是，國內人工智能領域近年來取得了不少新的突破和成績，在近期有關部門發佈的《2020人工智能中國專利技術分析報告》中可以看到，截至2020年10月，中國人工智能專利申請量累計已達69.4萬餘件，同比增長56.3 %；IDC相關調研報告中，對2020年全球各國AI計算的發展水平統計後發現，中國人工智能服務器佔全球市場三分之一左右，成為全球人工智能產業發展的中堅力量；而全球知名AI計算基準評測組織MLPerf在去年底也公佈了一份“2020年推理測試榜單”，中國科技企業的產品創造了18項全球性能紀錄……

但是，在人們討論國內人工智能領域的熱點話題時，也有不少挑戰與隱憂困擾着眾多參與者，尤其是AI應用及落地的進程中，痛點與焦慮也隨之出現，如果歸納總結一下，可以聚焦為這三個問題：

1．如何解決AI算力匱乏與成本高企的矛盾？

2．能否打造類似水電供給的AI算力基礎設施？

3．如何協同行業在AI應用落地過程中迎接“產業AI化”大潮？

破局，無疑要從滿足行業需求以及夯實發展基礎做起。

爆發的需求和“暴漲”的壓力

無產業不AI，無企業不AI——人工智能已經迅速滲透到各行各業的發展建設中，這已經是不爭的事實。

但是，太多問題也隨之而來：簡單點兒説就是各行各業對AI需求的“胃口”越來越大，但是AI能力的供給匱乏，而成本卻在“暴漲”。這正是AI在供需層面的痛點與矛盾。

關於需求的變化有兩點值得注意：一方面是量的增長，另一方面是質的變化。

IDC在2020年6月至8月期間，針對中國企業人工智能應用需求開展了一項專題調查和研究。調研發現，企業對於人工智能帶來的價值有了更深的認知，企業在人工智能應用上正在採取更多積極的舉措。

在懂懂看來，這其中最大的變化就體現在人工智能新的應用場景嘗試上，即除了已經得到多個行業驗證的通用場景之外，不同行業的用户還在根據自身的行業特性在進行積極嘗試，開闢一些新的碎片化應用場景。

數據顯示有超過九成的企業正在使用或計劃在未來三年內使用人工智能，其中，大部分企業採用了公有云、私有云加本地部署的混合架構來部署人工智能應用，而74.5%的企業期望在未來可以採用具備公用設施意義的人工智能新型基礎設施。請注意：這一期望也是不同地區和不同規模的企業的共識。

除了量的變化，AI算力方面的質變則更令人關注。

提到質變，首先要談一下AI模型。這其中，最具代表性的就是打敗李世石的Alpha GO，以及OpenAI實驗室去年推出的GPT3。前者因為在圍棋方面所展現的天賦盡人皆知，而後者則是在去年發佈後就引發了AI科學領域的震盪。

其實眾多AI模型的不斷出現，終極目標就是具備更高“等級”的智能。而每一次模型智能程度的提升，都使得模型也愈加複雜，模型尺寸也呈現爆發式增長。這裏打一個不是很恰當的比喻，如果我們將施瓦辛格主演的《終結者》裏面的天網，視為AI所能達到的的最高境界，那麼2012開始出現的AlexNet網絡模型，以及此後幾年的ResNet、Transformer、BERT直至GPT-3等優秀AI模型，就是在向天網這樣的終極目標邁進。

尤其是OpenAI實驗室推出的自然語言模型GPT-3，擁有1750億語言模型參數量，通過訓練已經可以寫詩、寫樂譜，回答歷史、天文問題，甚至涉足醫療領域，被一些科學家稱為“幼年期的天網”。與此同時，它也是名副其實的“算力吞噬者”。

顯然，越先進的大規模AI模型越需要耗費大量的計算資源，如果沒有強勁的算力支撐，訓練一個先進的模型所耗費的時間和金錢成本——絕對是很多人無法想象的。

舉一個簡單的例子：媒體機構量子位做了估算，訓練一個GPT-3模型需要一塊GPU運行355年；其訓練成本約在600-1200 萬美元。反觀2016年出現的Resnet-152模型，各方面成本不足GPT-3的萬分之三。

你覺得這已經很恐怖了？實際上就在2021年1月，谷歌大腦的科學家剛宣佈他們設計的簡化稀疏架構（Switch Transformer）能將語言模型的參數量擴展到1.6 萬億，這已經近十倍於GPT-3了。

無需咂舌，這就是AI進化過程中不可逆的質變。

中國工程院院士鄭緯民鄭緯民曾經指出，下一代AI的發展亟需建設大規模的AI算力基礎設施。GPT-3取得了很好的進步，但是離人類智能還有差距，下一代人工智能模型可能超過萬億參數。如今，這個萬億參數的AI“巨獸”已經到來。

而在懂懂看來，承載AI的新型算力基礎設施的供給水平，將成為直接影響AI創新迭代及產業AI應用落地的關鍵因素。對算力的渴求，對AI模型的智能化追求，已經愈發迫切地將AI算力基礎設施建設話題提到了重要環節。

AI算力的“地基”建設迫在眉睫

可以看到，隨着模型尺寸的不斷膨脹，如何做到高效的AI訓練和計算，關乎到AI生產研發效率，實現高效的AI模型訓練的一個重要的支撐是更快更強的算力，即可以在更短時間內完成大規模AI計算，這對於AI產品的迭代效率和成功至關重要。

那麼，如何打造一個強勁的算力支撐能力，如何有效降低訓練先進AI模型所需要時間和金錢？

首先強調一點，算力並不完全取決於芯片的能力。隨着越來越多的高級AI模型訓練開始“索求”巨量的算力支撐，計算力受芯片工藝的物理限制也愈發明顯，芯片製造工藝技術層面的提升速度已經落後於算法模型，某些模型已經逼近AI算力的極限。算力如果受限，算法模型的不斷創新也會出現制約。因此，算力已經成為未來人工智能應用取得突破的決定性因素。

在此前IDC聯合浪潮集團發佈的《2020-2021 中國人工智能計算力發展評估報告》中也指出，2020年，中國的GPU服務器依然佔據95%左右的市場份額，是數據中心人工智能加速方案的首選。未來幾年，隨着推理工作負載在各個行業應用中不斷增加，FPGA和ASIC等其他類型的加速芯片將在各個領域採用。

IDC預計到2024年，其他類型加速芯片的市場份額將快速發展，人工智能芯片市場呈現多元化發展趨勢。報告強調——服務器是人工智能基礎設施的核心，到2020年，中國人工智能基礎設施市場規模將達到39.3億美元，其中服務器支出佔比高達87%。

可以看到，人工智能服務器技術的不斷創新，包含了多種互聯方式和拓撲架構，以滿足不同的應用場景需求，與此同時，人工智能基礎設施正在向開放架構發展，以滿足高效、靈活、可擴展的下一代人工智能數據中心的需求。

這裏要強調一個關鍵詞：智算中心。實際上，在去年4月浪潮提出“智算中心”理念時，就指出要讓智慧計算可以像水電一樣，成為社會基本公共服務。

智算中心的意義，就是通過算力的生產、聚合、調度和釋放，高效支撐數據開放共享、智能生態建設、產業創新聚集，同時有力促進AI產業化、產業AI化及政府治理智能化。智算中心的內涵有着四個要點：一是算力公共基礎設施；二是計算架構技術領先、生態成熟；三是算力、數據和算法的融合平台；四是以產業創新升級為目標。

這四點，正是對前面提及的行業應用需求爆發、算力匱乏及成本高企，以及AI技術發展對算力支撐等痛點的最佳解決路徑。結合國家層面對人工智能為主的戰略性新興產業的發展規劃，AI算力在基礎設施層面的意義就更為突出和緊迫。

一方面，從去年兩會政府工作報告中提出“新基建”，就明確了以人工智能、特高壓等新技術發力技術端的基礎設施建設。而在新近發佈的十四五規劃建議中，提及重點關注的幾大前沿科技，人工智能與量子信息、集成電路位列前三位。因此，人工智能作為新一輪產業智能化變革的核心驅動力量，將會推動數萬億美元的數字經濟產業升級轉型。另一方面，作為AI算力的重要載體，實現算力、算法和數據全面融合的智能計算中心，將會為新基建發展所需的未來算力基礎設施提供重要參考定義。

也許有人會問，政府部門、不同行業、大型中小型企業能夠從智算中心這樣的基礎設施上獲得什麼？

首先，是推動國內AI產業化浪潮的創新發展進程。智算中心作為人工智能軟硬件技術的一體化融合載體，為人工智能產業的發展提供了大規模數據處理和高性能智能計算支撐，可以讓人工智能技術更加高效地實現訓練、推理等學習過程。一方面，智能計算中心的構建將推動“平台+應用+人才”三位一體的新型AI產業發展模式，另一方面，將會完善“算力+生態”體系，加速推進從基礎層到應用層的人工智能產業鏈的形成。

其次，是驅動產業AI化轉型升級。如同公有云對於企業信息化轉型所帶來的的裨益，智算中心作為新型基礎設施可以幫助企業低成本、高效率地進行數字化轉型。不同類型的企業，可以根據業務需要依託智算中心提供的AI模型庫、AI算力調度平台等自動生成適用於實際需要的業務系統模型。同時，智算中心通過提供算力基礎設施及通用軟件服務，聯動產業鏈上下游，可以為企業提供完整的AI服務鏈，幫助實現AI供給和需求的高效對接。

最後，是助力政府治理能力現代化。在當下智慧城市建設的進程中，智算中心能夠融合人工智能、互聯網、大數據、雲計算等信息技術，迅速將線上線下各類型治理主體聚合在一起，提供數據分析、雲計算平台、算法和計算能力等工具和資源，大大提升社會治理過程中的數據計算、分析、挖掘能力，從積極推動政府治理能力的現代化。

當然，這其中最關鍵的是要算經濟賬，提升效率、降低成本才是基礎設施對於所有行業最大的助力。可以看到，智算中心作為算力生產供應平台，在構建過程中以融合開放的架構計算系統為平台，以數據為資源，免費或低成本提供很多開源的人工智能算法及其代碼，以強大算力驅動AI模型來對數據進行深度加工，源源不斷產生各種智慧計算服務，通過服務形式向組織及個人進行供應。

同時，智算中心可以通過平台開放接口的方式，將行業領軍企業的算法能力、數據資源及運營服務等輸出給IT基礎薄弱的企業，使全社會AI應用成本得到大幅降低。

從這幾方面來看，智算中心作為新時代基礎設施建設的必要性毋庸贅言，而迫切性也不言而喻。

產業AI化——獨樂樂不如眾樂樂

從這幾方面來看，AI算力作為基礎設施建設的價值和意義已經非常明晰，那麼，在打造這一“地基”的產業變革中，浪潮又希望扮演一個什麼樣的角色？

在IDC發佈的2020HI《全球人工智能市場半年度追蹤報告》中可以看到，目前全球半年度人工智能服務器市場規模達55.9億美元，浪潮以16.4%的市場佔有率，位居全球人工智能服務器市場第一。從這一點來看，浪潮在AI產業化浪潮中可以繼續一路領先。

但是去年底在一些公開場合聽到浪潮AI&HPC;總經理劉軍分享自己的觀點時，有一句話引人關注。“從市場的量級來看，AI產業化是千億級別的市場，產業AI化是萬億級別的市場。我們在AI產業化可能走的更快一點，在產業AI化上可能需要抓緊趕上去。”

AI產業化與產業AI化在文字上的細微差別，背後卻是科技行業與所有行業在AI應用場景上的巨大差異。幫助所有行業落地和應用人工智能，才是一個無限寬闊的市場，和一個長久可持續的未來。

這其中，浪潮要做的不是自己一家獨大，而且協同更多的夥伴，把這個萬億市場共同做大、實現共贏。這，也是浪潮智算中心在新基建打造過程中所扮演的角色。

一方面，智算中心的建設要滿足三個基本條件：開放標準、集約高效和普適普惠；另一方面，這一體系將持續投入面向AI時代的三個要素——計算力輸出、服務能力優化及人才培養。在懂懂看來，只有在打造以AI算力為核心的基礎設施過程中，幫助和促進生態夥伴的優勢互補、強強聯合，共同成就行業最終用户，才是智算中心的商業化核心價值。而這種AI時代的“多贏”理念，確實遠遠超出了傳統意義上的“AI產業化”範疇。

從浪潮過去一段時間以來的各種舉措已經可以看到，其一直在不斷推動智算中心IT基礎設施建設朝着更深、更寬範疇發展。自1993年浪潮成功研製出中國首台小型機服務器以來，經過近30年的積累，浪潮已經攻克了高速互聯芯片、關鍵應用主機、核心數據庫、雲數據中心操作系統等一系列核心技術。現在，圍繞智算中心，浪潮持續深耕，開發出硬件重構的智算中心算力系統，以及軟件定義的智算中心操作系統等等。與此同時，在很多業務面浪潮與合作伙伴也在共同嘗試打造智算中心的底層，向政府和行業用户提供端到端的智慧服務，輸送源源不斷的計算力。

可以確定一點，產業AI化是要深入到每一個行業應用實踐中，具體的產品、具體的挑戰都要選擇適合的算法、模型和處理方式，浪潮攜手眾多理解行業應用場景的開發商、軟件商、集成商，與這些合作伙伴共同完成行業應用的落地，目標不僅是利己利他，而是對人工智能與綜合國力發展之間邏輯關係的透徹理解。

結束語

正如埃森哲研究所發現的，通過有效應用智能計算，中國經濟增長率有望上升至7.9％，增長額高達7.1萬億美元。未來，人工智能將每年為中國經濟增長貢獻0.8至1.4個百分點。

從這一點來看，智能計算產業作為數字經濟的重要載體，將作為一支新興力量，帶動全球數字經濟走向繁榮。人工智能計算需求未來將佔據80%以上的計算需求，智能計算正成為未來經濟的主要增長點之一。那麼，順勢而為的浪潮，也將在這一增長勢頭中起到令人矚目的推動作用。

本文（含圖片）為合作媒體授權創業邦轉載，不代表創業邦立場，轉載請聯繫原作者。如有任何疑問，請聯繫