【環球網科技綜合報道】9月25日,在HUAWEI CONNECT 2020期間,華為雲發佈ModelArts 3.0,融合骨幹模型、聯邦學習、智能評估、智能診斷和高效算力。
據華為雲AI首席科學家田奇介紹,華為雲長期紮根AI基礎技術研究,覆蓋計算機視覺、語音語義和決策優化三大AI領域,提出了六大基礎研究計劃。這些計劃產生的許多研究成果以即插即用的方式逐步部署於華為雲ModelArts,助力行業AI落地。
田奇表示,ModelArts在多個行業和項目中有了成功落地,這離不開華為雲EI在人工智能領域的長期投入。
“華為雲長期紮根AI基礎研究,覆蓋計算機視覺、語音語義和決策優化三大領域。我們聚焦於模型高效、數據高效、算力高效、知識高效4大方向,提出了六大基礎研究計劃,包括面向大模型的模型摸高計劃、面向小模型的模型瘦身計劃、面向多模態學習的數據魔方計劃、面向小樣本學習的數據冰山計劃、面向通用知識抽取的萬物預視計劃和麪向新學習範式的虛實合一計劃。”
華為雲的許多研究成果,包括自動機器學習、小樣本學習、聯邦學習、預訓練模型等,能夠即插即用地部署於ModelArts使能平台,助力AI賦能千行百業。
在多項業界公開競賽和測評中,華為雲EI的持續創新研究已經取得了不錯的成果,這些都將應用於ModelArts平台,提供給全球的開發者使用。
感知方面,華為雲在ImageNet大規模圖像分類、WebVision大規模網絡圖像分類、MS-COCO二維物體檢測、nuScenes三維物體檢測、視覺預訓練模型的下游 分類/檢測/分割等驗證中,均保持業界領先。目前,ModelArts驅動的感知模型已經在醫療影像分析、油氣勘探、工業故障檢測等領域獲得廣泛應用。
認知方面,依託語音語義和知識圖譜方向的積累,華為雲整合行業數據,對多樣、複雜、孤島化的數據進行治理,實現感知智能到認知智能的飛躍。目前,ModelArts驅動的認知模型已在藥物靶點預測、金融詐騙分析、智能售後客服等多項任務中得到應用。
決策方面,依託運籌優化、強化學習、智能控制等算法,華為雲已經構建起完整的決策底座,使得AI真正實現感知-認知-決策的智能閉環。目前,ModelArts驅動的決策引擎已經應用於機位分配、工業製造、智能交通、遊戲娛樂等領域。
“華為雲發佈的ModelArts3.0,是面向AI在行業落地提供的AI開發平台。在這裏,我和我的團隊主要是從技術領域進行探索和研究,如何通過AI技術高效解決行業挑戰,比如,如何用極少數據訓練出高精度模型?如何降低企業應用AI的門檻?如何解決企業對數據安全使用的顧慮等?最終,我們將骨幹模型、聯邦學習、智能診斷評估優化、和高效算力,很好的融入了ModelArts3.0。”田奇隨後為記者詳細解讀。
華為雲骨幹工具鏈EI-Backbone,整合模型高效、數據高效、算力高效、知識高效,全面提升行業AI落地能力。EI-Backbone的能力,已經在10餘個行業成功驗證,並且斬獲10餘個業界挑戰賽冠軍,發表100餘篇頂級論文。EI-Backbone提供了AI開發的新範式,以肺部醫療影像分割為例來介紹:
過去需要成百上千例標註數據才能進行的訓練,現在有了EI-Backbone,只需要幾十例甚至十幾例標註數據即可完成,節省標註成本90%以上。
過去需要大量專家經驗和試錯成本的模型選擇和超參調節,通過EI-Backbone提供的全空間網絡架構搜索和自動超參優化技術,可在無需人工干預的情況下快速完成,且精度大幅提升。
此外,過去需要幾周甚至更長時間,從頭開始的模型訓練、測試、驗收和部署流程,在加載EI-Backbone集成的預訓練模型後,可以縮短到幾小時甚至幾分鐘內完成,訓練成本降低90%以上。
基於EI-backbone技術,華為雲ModelArts和杭州雲深處科技有限公司合作,實現了四足機器狗的工業場景巡檢。
華為雲ModelArts 3.0的下一個特性是聯邦學習。眾所周知,數據是AI應用的基礎,只有基於多樣化的數據,才能實現AI智能感知。然而,在實際AI行業落地中,數據是分散在不同的數據控制者之間,這就導致了行業應用的數據孤島問題,使得AI算法訓練效果受到限制。
針對這個問題,華為雲Modelarts提供聯邦學習特性,實現數據不出户的聯合建模。用户各自利用本地數據訓練,不交換數據本身,只用加密方式交換更新的模型參數,實現協同訓練。
華為雲EI與中國科學院上海藥物所的蔣華良院士合作,將華為自研的FedAMP算法和AutoGenome算法應用到藥物研發的AI任務中,精準預測藥物水溶解性、心臟毒性和激酶活性,準確度遠超傳統的聯邦學習和深度學習算法。
此外,華為雲提供雲邊協同的服務,支持不同地點、不同客户的數據進行聯邦訓練,通過加密方式上傳服務端,對全局模型進行更新,再將其下發至邊緣設備,便捷支持同業態的橫向聯邦和跨業態的縱向聯邦學習。聯邦訓練參與者可以通過雲端,也可以通過華為雲邊緣設備(如智能小站)的計算能力參與聯邦訓練,實現行業內聯合建模。
模型在部署上線前,需要進行充分評估,結果優秀的模型直接投入生產環境,差強人意的則需要進一步優化迭代。ModelArts提供了全面的可視化評估、智能化診斷功能,使得開發者可以直觀的瞭解模型的各方面性能,進而針對性的進行調優或部署生產。
田奇以一個上皮病變細胞分類的模型評估進行詳細講解。
在精度方面,華為雲ModelArts提供了包含準確率、精確率、召回率、F1值、混淆矩陣、ROC曲線等常規指標,還包括了數據敏感度分析模塊,評估模型在不同數據特徵子區間上的表現;
在性能方面,ModelArts提供算子級別的時間、空間消耗統計分析和多種整體的性能指標,並且針對模型的表現給出相應建議,如模型量化、蒸餾等;
在可解釋性方面,ModelArts提供熱力圖,用以展示模型做出推理判斷所依據的區域;
在可信方面,ModelArts內置多種模型可信相關評測方法,提供多角度模型安全能力評估指標,並能依據當前模型表現給出相應的防禦建議。
隨着深度學習分佈式訓練的不斷髮展,各類模型的訓練對於計算設備的需求越來越大。但由於各種原因,訓練作業的資源還沒有被充分利用。造成資源浪費的原因非常多,主要包括以下幾點:
訓練算法代碼本身質量不高、資源利用率低;模型大小和超參數的設置也會顯著地改變計算資源的利用率;資源池整體利用率存在波動峯谷。類似於“峯谷電”,訓練作業的提交也有高峯期和低谷期,造成很大的資源浪費。
彈性訓練是ModelArts的核心能力之一,可以根據模型訓練速度的需求自適應實現資源的最佳分配。
ModelArts提供兩種模式,一是Turbo模式,可以充分利用空閒資源加速已有訓練作業,訓練速度可提升10倍以上,並且不影響模型的收斂精度;二是經濟模式,可以通過最大化資源利用率給開發者提供極致的性價比,在大多數典型場景下可以提升性價比30%以上。
為了更好地支持超大算力需求的AI研發,華為ModelArts平台在集羣規模,任務數量,以及分佈式訓練都做了針對性的優化。
ModelArts研發平台能夠管理上萬的節點,更好的支持大型訓練任務需求。通過優化服務框架,ModelArts平台支持10萬級別的作業同時運行、支持萬級芯片的大規模分佈式任務。
優秀的分佈式加速比是大規模集羣分佈式訓練的關鍵能力,也是促使用户選擇使用大規模集羣來加速AI業務的關鍵因素。
華為雲ModelArts領先的分佈式加速比能力,在MLPerf benchmark Imagenet-1K分類任務上,使用512芯片集羣跑出93.6秒的成績,優於NVIDIA V100的120秒。
在骨幹網絡、聯邦學習、模型診斷優化、高效算力的加持下,華為雲ModelArts會加速AI在行業落地。未來,華為雲將持續聚焦於模型高效、數據高效、算力高效和知識高效4個重點方向,紮根於AI基礎研究。在計算機視覺、語音語義、決策優化3大AI領域進行基礎研究計劃投入,
最後,田奇表示:“我們會持續努力,提供強大的AI技術支持每一位開發者發揮所長、創造獨特價值。華為雲將持續踐行普惠AI,與全球開發者共成長。”