很多企業正在創建和使用大量數據,並將更多數據存儲在雲中。如果戰略性地使用這些數據,則可以改善其業務成果。數據增長也為企業數據管理系統帶來了一些挑戰和機遇。
企業面臨的一個主要挑戰是數量。隨着企業創建和收集更多數據,他們需要管理和存儲更多數據。由於雲計算的可擴展性和低成本,企業現在也越來越依賴於雲計算技術來滿足企業數據管理系統的存儲需求。
根據調研機構IDC公司發佈的《全球DataSphere預測》報告,2020年,全球各地的企業將創建和捕獲6.4ZB的新數據。根據IDC公司的調查,就創建何種類型的新數據而言,生產力數據(或運營、客户和銷售數據以及嵌入式數據)是增長最快的數據類別。
IDC公司Global DataSphere研究副總裁John Rydning表示:“生產力數據涵蓋了我們在個人電腦、企業服務器或計算機上創建的大多數數據。生產力數據還包括由嵌入在工業設備和端點的傳感器捕獲的數據,企業可以利用這些數據來降低成本或增加收入。”
Rydning還指出,在調查中看到了與生產力相關的元數據的增長,這些元數據提供了有關捕獲或創建數據的其他數據,這些數據可用於進行更深入的分析。
由信息安全和事件管理廠商Splunk公司發起的一項企業戰略小組的調查,通過數據成熟度對企業進行排名,發現很少有企業是數據創新者。
數據增長世界中的企業數據管理系統挑戰
展望未來,Rydning看到了企業數據管理方面將要面臨的挑戰。也許最大的問題是處理不斷增長的存檔數據。對於存檔數據,企業需要決定是否更好將數據保存在相對可訪問的存儲系統中,以便進行人工智能分析,或者將數據移至磁帶等成本較低的存儲介質上是否更經濟。
另一個挑戰是處理來自網絡邊緣的數據,預計在未來幾年會有所增長。還有一個問題是,企業應該在哪裏存儲參考數據,以便進行快速分析。
Rydning説:“企業越來越需要做好準備,以跟上在為工作流和業務流程提供服務的各種端點設備上生成數據的增長。”
雲中的數據管理挑戰
在2019年,34%的企業將數據存儲在雲中。IDC公司預計,到2024年,將有51%的企業將數據存儲在雲中。
儘管雲計算提供了比內部部署更具擴展且通常更容易存儲數據的方式,但並非所有數據都具有相同的價值。
總部位於舊金山的供應商Splice Machine公司聯合創始人兼首席執行官Monte Zweben説:“很多企業正在將數據轉儲到存儲系統中,而無需考慮使用它們的應用程序。他們只是替代了廉價的雲存儲,沒有繼續對其進行管理或將其轉變為有用的數據。現在,它變成了雲數據沼澤。”
Splice Machine公司開發了具有集成機器學習功能的分佈式SQL關係數據庫管理系統。儘管僅將數據轉儲到雲平台中並不是一個好主意,但這並不意味着Zweben反對雲存儲的主意。
實際上,Zweben建議企業使用雲計算平台,因為雲存儲相對便宜。關鍵是要確保企業找到有效利用這些數據的方法,而不僅僅是轉儲數據。
Zweben説:“人們可能以後會意識到需要在以前認為沒有用的數據上訓練機器學習模型。”
數據創新者的經驗教訓
Splunk公司首席技術倡導者Andi Mann表示:“毫無疑問,一些企業正在雲中存儲大量低價值數據。但是很難説任何特定的數據集對於給定的業務都是不必要的。”
在他看來,面臨的問題不一定是存儲不需要的數據,而是存儲沒有被有效使用的數據。
Splunk公司贊助Enterprise Strategy Group(ESG)於2019年3月進行了一項關於數據價值的研究。該報告基於1,350位企業和IT決策者的反饋,按數據成熟度級別對用户進行了細分,其中“數據創新者”是最高類別。
Mann説,“雖然許多企業確實擁有大量數據,並且可能會將它們歸入數據創新者類別,但是數據創新者與其他組織之間的真正區別不是擁有多少數據,而是它們如何使企業能夠訪問和使用它。”
該報告發現,88%的數據創新者聘用了高技能的數據研究者。但是,只是擁有熟練的技術人員也不夠,因此85%的創新型企業使用了一流的分析工具,並確保輕鬆訪問它們。
Mann説:“不要考慮不必要的數據,而要考慮如何以節省成本的方式存儲低價值的數據,同時使可以在需要時發表重要見解。關鍵是根據數據的潛在價值來處理數據,同時始終準備重新評估其價值。”