本文轉自【人民郵電報】;
大數據分析工具是指通過數據挖掘、語義分析、預測性分析等技術,對規模巨大的數據在合理時間內進行獲得、管理、處理、整理,展現數據價值的軟件。隨着企業的數據量不斷攀升,數據種類和結構愈加豐富,企業分析場景日益多樣化,大數據分析工具得到充分發展。當前,全球大數據分析工具市場產品呈現多行業、多場景遍地開花的狀態。
一、國內大數據展示工具發展勢頭良好,在國內市場佔有一席之地。分析展示工具通常被企業用於將現有的數據通過數據挖掘技術從大型數據集中發現、識別模式轉化為知識,從而幫助企業作出明智的問題診斷和業務經營決策。分析展示工具以圖形、圖表、信息圖表等方式對數據進行統計、分析、彙總和展示。2019年,國內數據展示類工具逐步被市場認可,BI軟件(商業智能軟件)作為大數據展示類工具的典型代表,強調報表等可視化功能展示。2019年上半年,帆軟憑藉本地化高效服務和穩健產品,以14.9%的國內市場份額成為BI市場的“領頭羊”,緊隨其後的是SAP、微軟、IBM和SAS四家公司。2020年Gartner發佈的BI魔力象限報告中,阿里雲首次上榜,顯示出國內大數據展示類工具不論從技術層面還是服務層面均逐步得到市場認可。
二、國內大數據挖掘工具與國外差距較大,仍有較大發展空間。數據挖掘工具作為融合人工智能、機器學習等前沿技術的研究成果,通常被認為是分析預測類工具的典型代表,需要企業大量的資源投入和技術沉澱,國內市場幾乎被國外產品佔據。2019年數據挖掘工具市場份額前五名均為國外企業,分別是SAS、IBM、RapidMiner、KNIME和微軟,國內企業僅有神舟通用的K-Miner佔有少量市場份額。縱觀數據挖掘工具,不論是從數量、成熟度還是用户量來看,國內產品與國外產品相比仍有較大差距。
大數據分析工具發展趨勢
增強分析成為大數據分析工具的未來發力點。隨着企業越來越需要消化多來源、不斷變化的數據,為降低技術人員的工作壓力,提高大數據分析效率,增強分析技術應運而生。增強分析通過人工智能、機器學習等信息技術在傳統分析功能中加入更多增強功能,使得不論是個人用户還是企業數據分析專家,都能夠自動化地、以更低門檻的方式分析、挖掘、測試、驗證、展現大數據價值,增強人類評估數據的能力。在準備數據階段,增強分析可以推薦最適合的業務數據源;在業務發現階段,增強分析可以幫助實現自動建模、模型管理、代碼生成等高階功能;在分享階段,可以通過增強分析帶來一些自動的業務發現。
隨着數據價值的提升與數據量的增長,不僅是數據科學家或數據分析師,還有大量營銷和其他非技術人員也需要洞察數據,從數據中尋求最優價值的實現方式。目前處於國外商業智能趨勢風口的諸如自然語言搜索、語音生成、自動生成等增強分析功能在國內仍停留在概念階段,並未形成規模化市場應用,增強分析技術賦能傳統大數據分析工具將會成為未來供應商競爭差異化的關鍵核心和投資方向。
大數據分析工具增強系統融合,提高企業數據服務化能力。企業IT建設過程逐漸由信息化、數字化到如今倡導的數智化,數據分析應該服務於人類的需要。大數據分析工具未來應具備較強的數據服務能力,幫助企業將業務端的需求通過大量數據與智能手段自動地解決。大數據分析工具應該向與業務深度綁定的方向發展。國內大數據分析工具起步晚,傳統明確切割的產品交付是否能滿足客户需求、如何實現彎道超車,工具服務能力的提升或許是一大關鍵要素。國內相關工具在針對本土化數據對接、定製化系統集成、嵌入式分析方式等方面優勢顯著,注重信息系統和大數據分析工具的融合成為企業成功的契機,這也是國內大數據分析工具彎道超車的好機會。
大數據分析工具服務雲化未來將快速發展。傳統大數據分析工具由於數據量、安全性等因素考慮以本地部署為主,這不利於數據的流通與共享,大數據分析工具雲化有助於眾多中小企業對工具進行快速構建,降低使用成本。隨着越來越多企業中國信息通信研究院雲計算與大數據研究所劉思源的數據和系統上雲,分析工具雲化對於高效分析、挖掘、展示數據價值的重要性不言而喻。2019年是向雲生態系統主導地位過渡的一年。微軟的快速增長基於Azure BI雲服務力量,Salesforce收購Tableau和Google收購Looker,標誌着雲化將使廠商可以擁有一個具有價格競爭力的平台。未來,大數據分析工具服務雲化將成為廠商的競逐之地。
當前,我國大數據分析工具發展已取得初步成就,帆軟、普元等一大批大數據分析工具提供商如雨後春筍般不斷湧現,成為金融、教育等行業選擇數據分析工具時重點關注對象。為了抓住機遇,彌補起步晚、用户少等不足,我國業界各方應積極合作,構建開放產業生態,提高技術創新能力,深耕細分行業,逐步實現從跟隨向引領的提升。