為什麼談硬件,必言軟件
數據即價值。
但是,僅僅擁有可用的數據並不意味着可以充分利用數據價值。
企業要思考一個關鍵問題:我們如何發掘數據中藴藏的卻又難以觸及的潛力,不斷推進目標並增加營收?
為了尋求答案,越來越多的企業訴諸於開源解決方案。
企業正在評估並完善開放式架構,從而將計算、網絡和存儲資源整合在一起。可擴展的硬件基礎架構支持軟件的不斷集成和開發。
與神秘的封閉架構不同,開源軟件以及越來越多的硬件提供更好的可視性和控制性,從而打破協作障礙,使科技產業更為民主化。
2018年IDC TechScape研究發現:“大多數重要的新興技術都是部分或全部由開源組件構成,這為行業未來的走向指明瞭方向。”
開源架構優勢明顯:
以希捷為例,它屬於硬件陣營。但是,由於創新同樣來源於開源世界,他們努力突破硬件廠商的侷限,在軟件領域不斷創新,力圖在軟件方面有所作為。
譬如相應地優化軟硬件系統,改善對象存儲。那麼,硬件公司在軟件領域能做什麼?
硬件和軟件互為陰陽,任何一方都需要不斷創新以跟上另外一方的要求。數據的流動需要軟件和硬件協同來實現。硬件設計的經驗為軟件層的數據處理提供洞見。同時從軟件世界中汲取的經驗教訓也有助於硬件的設計優化。
開源架構與數據存儲解決方案正在共同致力於如下問題:多雲、數據流、數據訪問、數據可視性以及安全性。
多雲
隨着企業從公有云轉向多雲,企業期望混合雲能兼具公有云的便捷靈活,以及私有云的自主可控。
開源項目包括Apache Hadoop和Ceph,支持存儲的橫向擴展,幫企業通過擴展計算與存儲搭建更強大的私有云,實現多雲部署。
硬件如何發揮作用?針對工作負載優化的硬件集羣以模塊化部署,輔助以橫向擴展的軟件生態系統,將幫助企業搭建私有云。
如果系統需要低延遲,則全閃存陣列SSD是適當的解決方案;如果私有云需要海量存儲,則硬件架構需要容納獨立的構建模塊。
數據流
由於邊緣、物聯網和其他技術的興起,數據正在從邊緣到核心爆發。到2025年,數據圈將達到175ZB。
在哪裏以及如何存儲和處理所有這些數據?開源軟件提供了構建模塊,基礎架構設計師能夠開發針對不同應用進行優化的解決方案。
例如,開源流處理平台Kafka;構建在Hadoop上的數據倉庫框架Hive;以及將數據存儲在操作系統數據庫的解決方案Redis,等等。
這對硬件意味着什麼?哪些構建模塊組合在一起去獲取所需的數據?用什麼速度去獲取?使用什麼工具進行數據分析?所有這些都關係到如何配置計算和存儲組件。
為促進雲基礎架構的有機增長,可隨時組合和拆分的架構將更能發揮資源的效率。
數據訪問
由於數據需求指數級增長,數據訪問更為重要。硬盤容量的增加將滿足於存儲密度的需求,數據的讀寫速度也要提升,而整體成本也要進一步下降。
硬件有什麼作用?研究人員不斷革新NAND技術,在保持同等水平延遲和帶寬的同時,降低成本。
雙磁臂等技術正在為大容量設備提供更高的IOPS性能。這為架構師們提供了更多的選擇,使他們能夠配置滿足各種應用需求的系統。
數據的可視性
軟硬件集成的另一方面是對系統信息的可視性需求。軟件的大趨勢是自動編排並自動管理多雲基礎架構。Kubernetes容器編排生態系統與Prometheus等成熟的開源工具相結合,即可創新架構的自主管理。
硬件世界的數據可視性如何保證?温度和振動等因素的可視性對硬件的優化十分重要。通過硬件與固件層面的創新,相應的人工智能工具得以應用,獲取更清晰的遙測數據與監測指標。
企業設備可以開放公開日誌,提供更多詳細信息。
數據安全
按照《通用數據保護條例》(GDPR)等法規規定,數據的溯源、移動、計算和存儲的需求不斷增長。開源解決方案更流行,這是因為開放源代碼增加了可信度。
這在硬件上如何體現?RISC-V架構是一個開源的電子指令集,專注於低成本、低功耗和高安全性,幫助企業通過共享模式更快地設計、開發電子產品芯片。
無論挑戰涉及安全性、可視性、數據訪問、數據流還是多雲,硬件都必須關注軟件世界。因為一旦涉及到數據,硬件和軟件註定要相互成就,相伴相生。雷鋒網雷鋒網雷鋒網