隨着5G時代的到來,運營商將遇到比前幾代移動網絡更為繁瑣的工作。5G網絡在規劃、部署和管理方面都更加複雜,並且這種複雜性將貫穿網絡和服務領域。
由於5G網絡與前幾代網絡共存,並且引入了網絡切片、大規模多輸入多輸出天線、軟件定義網絡和網絡功能虛擬化等技術,網絡管理將變得更加複雜。
同時,運營商還需要管理越來越多的終端設備,來保障越來越多的服務,處理5G網絡流量產生的大量數據。為滿足客户要求並實現運營目標,對於這些海量數據,僅依靠傳統分析流程遠遠不夠。
要應對這些挑戰,運營商需要實現AI技術的實時智能、預測和決策功能,網絡需要更加智能化。
網絡AI化已成行業共識
事實上,網絡AI化已經是一個長期的話題,運營商一直在利用SDN、NFV和雲技術,來提升業務和網絡敏捷性,降低運維複雜性和成本。應用多種智能技術幫助運營商從自動化邁向智能化是大勢所趨。
我們知道,5G網絡是一個全雲化的網絡,比傳統網絡有更大優勢實現更高級別的智能化,所以網絡AI化亦是5G網絡發展的必然。例如5G智能化的網絡切片,基於AI可以根據用户不同的業務需求,選擇最適合的切片部署一個模型;再有在業務預測方面,可以利用AI來實現根據業務需求變化的資源實時調整等等。
的確,AI技術可以應用於電信網絡的多個層級,並改變加速網絡運行的效率。
首先,AI在基礎設施層可以為硬件設施提供AI加速器,可實現不同層級的訓練和推理能力,例如加速核心數據中心全局性的策略或算法模型的集中訓練及推理需求,或者在基站內嵌AI加速器以支撐設備級的AI策略及應用。
其次,AI在網絡和業務控制層,可以對網絡和業務實現智能網絡優化、運維、管控和安全;可實現網絡各層級KPI優化、網絡策略優化,例如在無線的覆蓋優化、容量優化、負荷優化等。
第三,AI在運維和編排層的應用,可優先在大數據平台上引入AI引擎,對OSS和BSS數據做更深度的智能化挖掘。
而從場景的角度,AI技術可以在三大場景中賦予網絡“智慧”的能力。一是高效智慧運維場景,利用AI技術針對網絡進行預防性/主動性維護,改善網絡質量、提升MTTR;二是個性化業務服務場景,利用AI和大數據,給客户提供個性化服務的分析和建議,例如設計個性化業務和靈活的資費模式;三是網絡安全場景,利用AI能力,在惡意流量攻擊的早期就能正確識別,對於潛在的、前期未有訓練數據的惡意報文也能進行預警。
不難發現,AI能力有效的解決傳統電信網絡在運維、業務創新和網絡安全等方面面臨的挑戰,這讓網絡AI化成為了電信網絡升級的必由之路。
雲地協同
對網絡AI化的價值和意義
當網絡AI化成為了電信運營商的一種共識,AI技術與場景結合在走向落地的階段,也遭遇到一些AI規模化應用的新問題。
很多運營商在網絡AI化的實踐中發現:網絡AI在走向規模化工程應用的過程中存在很多挑戰,如模型泛化能力差、模型易老化、本地樣本少等問題。
這些問題也的確存在很多共性,比如模型泛化能力差會因為本地資源受限,導致AI模型規模應用難,如果三個月不更新AI模型,應用的精度就下降到70%以下,同時部分場景單局點樣本量少,又不足以支撐模型訓練。
正是看到了這些共性的難題,華為提出雲地協同創新方案,希望通過雲地協同,來加速AI特性的規模部署。
那麼,什麼是雲地協同?
按照官方的定義,雲地協同是指:雲端和地端一起協作完成數據樣本上雲,模型狀態管理,模型重訓練,模型/ 知識下發、擇優更新等一系列的閉環任務,同時把雲端彙集的全局網絡知識經驗、全量數據訓練得到的高精度模型,持續注入地端,讓電信網絡能夠進行智能的迭代升級,變得越來越聰明。
簡單的理解,這種模式其實就是把數據服務和模型訓練這些較“重”的工作放在雲上去做處理,然通過將一些較“輕”的本地模型推理放在邊緣設備上,一重一輕,兼顧了高質量的同時做到了及時性。
也許很多人會有這樣的疑問,雲地協同將AI的訓練與推理進行了拆分,這是不是本身對網絡傳輸的要求就會更高。沒錯,雲地協同最關鍵的一點就是要保證雲端和地端要有快速的通道。同時,從地端到雲端,信息可以從運營商上傳到雲端,而從雲端到地端,可以下發新的模型。
在這個過程當中,地端會對模型進行監控和評估,而云端會存儲超過3個月以上週期的樣本生成相比本地更高質量的模型。同時,雲端通過彙集和沉澱專家經驗和產品知識,運用知識圖譜等技術,形成 “網絡知識庫”,這些知識又可以持續注入地端,通過雲與地之間的相互印證不斷優化,達到提升網絡智能水平的目的。
從場景化與用户視角
解決網絡AI規模複製難題
我們知道,任何技術只有在場景中發揮價值,才是商業化成功的基礎,網絡AI化如此,雲地協同亦如此。
所以,針對電信網絡的不同應用場景,華為雲地協同在實際應用部署時也提供了不同的模式。
比如,核心網變更在線機器值守這種模型簡單,算法結構穩定的場景。華為採取了雲端進行初始模型的訓練,運行態由地端根據新增的樣本進行在線學習,持續保持模型的精度;
再比如,無線KPI異常檢測這一類模型相對複雜的場景,華為則在雲端進行模型的分發,然後在地端根據新增樣本進行在線學習;而如IP RAN/PTN智能告警,DC PUE優化等模型複雜、需要用到華為雲端高質量標註數據,知識圖譜以及仿真等知識能力進行模型優化的場景,華為則利用雲地實時協同,讓模型可以自動化演進。
從效率的角度,雲地協同可以提升模型泛化能力和訓練效率,同時通過構建網絡知識庫,會提升故障運維輔助效率。而從安全的角度,因為建立了雲端仿真,所以模型及業務驗證安全高效,同時也會提升模型版本管理效率,加速AI特性更新。
不難總結,雲地協同可以實現一點生效,全網複製,AI的特性在一個局點成功實施後,快速 的形成知識和經驗,在其他局點進行復制,實現在全網規模應用。
客觀地説,雲地協同模式,是華為在網絡AI化的趨勢中,通過具體應用場景的需求,逆推出來的成果,其對電信網絡智能化升級的意義深遠。