數據中心是許多基於Internet的服務和應用程序的骨幹,其需求正日益增長,這要求使用新的數據庫和數據存儲技術。
數據中心不斷增加的工作量要求使用新的方法來存儲和訪問數據。韓國大邱慶北科技大學的研究人員開發了一種新方法來管理固態驅動器中的數據庫,從而顯着改善了讀取/寫入延遲的性能,並從CPU上卸載了數據庫計算任務,從而提高了效率並降低了功耗。
隨着Web服務,雲存儲和大數據服務的不斷擴展,它們所依賴的龐大的硬件基礎架構(稱為數據中心)需要進行改進以適應當前的需求。一種用於改善性能並減少與讀寫大量數據相關的能量負荷的有前途的解決方案是賦予存儲設備某些計算能力,並從CPU卸載部分數據讀寫過程。
韓國大邱慶北科技大學(DGIST)的研究人員在2020年USENIX年度技術會議上發表的最新研究中,描述了在固態硬盤(SSD)中實現鍵值存儲的新方法,該方法提供了許多與更廣泛使用的方法相比具有優勢。
鍵值存儲(也稱為鍵值數據庫)是一種以鍵值對形式存儲,管理和檢索數據的方法。最常見的實現方法是使用哈希函數,該算法可以快速將給定密鑰與其關聯的存儲數據進行匹配,以實現快速的讀/寫訪問。
實現基於散列的鍵值存儲的主要問題之一是散列函數的隨機性偶爾會導致讀/寫操作的長時延(延遲)。為了解決這個問題,DGIST的研究人員實施了另一種範例,稱為“日誌結構合併樹(LSM)”。這種方法依賴於對數據進行分層排序,因此在最大延遲上設置了上限。
在其實現中,綽號為“ PinK”,他們解決了基於LSM的SSD密鑰值存儲的最嚴重限制。憑藉其優化的內存使用,保證的最大延遲以及用於從CPU卸載某些分類任務的硬件加速器,PinK代表了數據中心SSD數據存儲的一種新穎而有效的方法。主持該研究的李成進教授表示:“鍵值存儲是廣泛應用的基礎架構,可用於各種應用程序,包括Web服務,人工智能應用程序和雲系統。我們相信PinK可以極大地改善用户感知的性能這些服務。”
到目前為止,實驗結果證實了這種新實現方式所提供的性能提升,並突顯了讓存儲設備自行計算某些操作的潛力。Lee教授總結道:“我們相信我們的研究為應該如何設計和構建計算存儲設備以及應該解決哪些技術問題提供了一個很好的指導。”