資料即價值。
但是,僅僅擁有可用的資料並不意味著可以充分利用資料價值。
企業要思考一個關鍵問題:我們如何發掘資料中蘊藏的卻又難以觸及的潛力,不斷推進目標並增加營收?
為了尋求答案,越來越多的企業訴諸於開源解決方案。
企業正在評估並完善開放式架構,從而將計算、網路和儲存資源整合在一起。可擴充套件的硬體基礎架構支援軟體的不斷整合和開發。
與神秘的封閉架構不同,開源軟體以及越來越多的硬體提供更好的可視性和控制性,從而打破協作障礙,使科技產業更為民主化。
2018年IDC TechScape研究發現:“大多數重要的新興技術都是部分或全部由開源元件構成,這為行業未來的走向指明瞭方向。”
開源架構優勢明顯:
以希捷為例,它屬於硬體陣營。但是,由於創新同樣來源於開源世界,他們努力突破硬體廠商的侷限,在軟體領域不斷創新,力圖在軟體方面有所作為。
譬如相應地最佳化軟硬體系統,改善物件儲存。那麼,硬體公司在軟體領域能做什麼?
硬體和軟體互為陰陽,任何一方都需要不斷創新以跟上另外一方的要求。資料的流動需要軟體和硬體協同來實現。硬體設計的經驗為軟體層的資料處理提供洞見。同時從軟體世界中汲取的經驗教訓也有助於硬體的設計最佳化。
開源架構與資料儲存解決方案正在共同致力於如下問題:多雲、資料流、資料訪問、資料可視性以及安全性。
多雲
隨著企業從公有云轉向多雲,企業期望混合雲能兼具公有云的便捷靈活,以及私有云的自主可控。
開源專案包括Apache Hadoop和Ceph,支援儲存的橫向擴充套件,幫企業透過擴充套件計算與儲存搭建更強大的私有云,實現多雲部署。
硬體如何發揮作用?針對工作負載最佳化的硬體叢集以模組化部署,輔助以橫向擴充套件的軟體生態系統,將幫助企業搭建私有云。
如果系統需要低延遲,則全快閃記憶體陣列SSD是適當的解決方案;如果私有云需要海量儲存,則硬體架構需要容納獨立的構建模組。
資料流
由於邊緣、物聯網和其他技術的興起,資料正在從邊緣到核心爆發。到2025年,資料圈將達到175ZB。
在哪裡以及如何儲存和處理所有這些資料?開源軟體提供了構建模組,基礎架構設計師能夠開發針對不同應用進行最佳化的解決方案。
例如,開源流處理平臺Kafka;構建在Hadoop上的資料倉庫框架Hive;以及將資料儲存在作業系統資料庫的解決方案Redis,等等。
這對硬體意味著什麼?哪些構建模組組合在一起去獲取所需的資料?用什麼速度去獲取?使用什麼工具進行資料分析?所有這些都關係到如何配置計算和儲存元件。
為促進雲基礎架構的有機增長,可隨時組合和拆分的架構將更能發揮資源的效率。
資料訪問
由於資料需求指數級增長,資料訪問更為重要。硬碟容量的增加將滿足於儲存密度的需求,資料的讀寫速度也要提升,而整體成本也要進一步下降。
硬體有什麼作用?研究人員不斷革新NAND技術,在保持同等水平延遲和頻寬的同時,降低成本。
雙磁臂等技術正在為大容量裝置提供更高的IOPS效能。這為架構師們提供了更多的選擇,使他們能夠配置滿足各種應用需求的系統。
資料的可視性
軟硬體整合的另一方面是對系統資訊的可視性需求。軟體的大趨勢是自動編排並自動管理多雲基礎架構。Kubernetes容器編排生態系統與Prometheus等成熟的開源工具相結合,即可創新架構的自主管理。
硬體世界的資料可視性如何保證?溫度和振動等因素的可視性對硬體的最佳化十分重要。透過硬體與韌體層面的創新,相應的人工智慧工具得以應用,獲取更清晰的遙測資料與監測指標。
企業裝置可以開放公開日誌,提供更多詳細資訊。
資料安全
按照《通用資料保護條例》(GDPR)等法規規定,資料的溯源、移動、計算和儲存的需求不斷增長。開源解決方案更流行,這是因為開放原始碼增加了可信度。
這在硬體上如何體現?RISC-V架構是一個開源的電子指令集,專注於低成本、低功耗和高安全性,幫助企業透過共享模式更快地設計、開發電子產品晶片。
無論挑戰涉及安全性、可視性、資料訪問、資料流還是多雲,硬體都必須關注軟體世界。因為一旦涉及到資料,硬體和軟體註定要相互成就,相伴相生。雷鋒網雷鋒網雷鋒網