很多企業正在建立和使用大量資料,並將更多資料儲存在雲中。如果戰略性地使用這些資料,則可以改善其業務成果。資料增長也為企業資料管理系統帶來了一些挑戰和機遇。
企業面臨的一個主要挑戰是數量。隨著企業建立和收集更多資料,他們需要管理和儲存更多資料。由於雲計算的可擴充套件性和低成本,企業現在也越來越依賴於雲計算技術來滿足企業資料管理系統的儲存需求。
根據調研機構IDC公司釋出的《全球DataSphere預測》報告,2020年,全球各地的企業將建立和捕獲6.4ZB的新資料。根據IDC公司的調查,就建立何種型別的新資料而言,生產力資料(或運營、客戶和銷售資料以及嵌入式資料)是增長最快的資料類別。
IDC公司Global DataSphere研究副總裁John Rydning表示:“生產力資料涵蓋了我們在個人電腦、企業伺服器或計算機上建立的大多數資料。生產力資料還包括由嵌入在工業裝置和端點的感測器捕獲的資料,企業可以利用這些資料來降低成本或增加收入。”
Rydning還指出,在調查中看到了與生產力相關的元資料的增長,這些元資料提供了有關捕獲或建立資料的其他資料,這些資料可用於進行更深入的分析。
由資訊保安和事件管理廠商Splunk公司發起的一項企業戰略小組的調查,透過資料成熟度對企業進行排名,發現很少有企業是資料創新者。
資料增長世界中的企業資料管理系統挑戰
展望未來,Rydning看到了企業資料管理方面將要面臨的挑戰。也許最大的問題是處理不斷增長的存檔資料。對於存檔資料,企業需要決定是否更好將資料儲存在相對可訪問的儲存系統中,以便進行人工智慧分析,或者將資料移至磁帶等成本較低的儲存介質上是否更經濟。
另一個挑戰是處理來自網路邊緣的資料,預計在未來幾年會有所增長。還有一個問題是,企業應該在哪裡儲存參考資料,以便進行快速分析。
Rydning說:“企業越來越需要做好準備,以跟上在為工作流和業務流程提供服務的各種端點裝置上生成資料的增長。”
雲中的資料管理挑戰
在2019年,34%的企業將資料儲存在雲中。IDC公司預計,到2024年,將有51%的企業將資料儲存在雲中。
儘管雲計算提供了比內部部署更具擴充套件且通常更容易儲存資料的方式,但並非所有資料都具有相同的價值。
總部位於舊金山的供應商Splice Machine公司聯合創始人兼執行長Monte Zweben說:“很多企業正在將資料轉儲到儲存系統中,而無需考慮使用它們的應用程式。他們只是替代了廉價的雲端儲存,沒有繼續對其進行管理或將其轉變為有用的資料。現在,它變成了雲資料沼澤。”
Splice Machine公司開發了具有整合機器學習功能的分散式SQL關係資料庫管理系統。儘管僅將資料轉儲到雲平臺中並不是一個好主意,但這並不意味著Zweben反對雲端儲存的主意。
實際上,Zweben建議企業使用雲計算平臺,因為雲端儲存相對便宜。關鍵是要確保企業找到有效利用這些資料的方法,而不僅僅是轉儲資料。
Zweben說:“人們可能以後會意識到需要在以前認為沒有用的資料上訓練機器學習模型。”
資料創新者的經驗教訓
Splunk公司首席技術倡導者Andi Mann表示:“毫無疑問,一些企業正在雲中儲存大量低價值資料。但是很難說任何特定的資料集對於給定的業務都是不必要的。”
在他看來,面臨的問題不一定是儲存不需要的資料,而是儲存沒有被有效使用的資料。
Splunk公司贊助Enterprise Strategy Group(ESG)於2019年3月進行了一項關於資料價值的研究。該報告基於1,350位企業和IT決策者的反饋,按資料成熟度級別對使用者進行了細分,其中“資料創新者”是最高類別。
Mann說,“雖然許多企業確實擁有大量資料,並且可能會將它們歸入資料創新者類別,但是資料創新者與其他組織之間的真正區別不是擁有多少資料,而是它們如何使企業能夠訪問和使用它。”
該報告發現,88%的資料創新者聘用了高技能的資料研究者。但是,只是擁有熟練的技術人員也不夠,因此85%的創新型企業使用了一流的分析工具,並確保輕鬆訪問它們。
Mann說:“不要考慮不必要的資料,而要考慮如何以節省成本的方式儲存低價值的資料,同時使可以在需要時發表重要見解。關鍵是根據資料的潛在價值來處理資料,同時始終準備重新評估其價值。”