分佈式數據庫進入實時時代,PingCAP 的選擇

隨着企業數字轉型進程的加快,行業數字化場景也呈現出爆發式增長。

隨之而來的就是海量的業務數據,以及實時、在線的數據分析的能力需求。這一趨勢之下,傳統集中式數據庫、中間件、大數據等多組件協同的異構數據棧暴露出上線難、維護成本極高等問題,嚴重阻礙企業數字化進程。

因此,什麼樣的數據庫才是一款真正的企業級數據庫?成為了數據庫從業者思考的重點。

什麼才是企業數據庫?

“沒有人會沒事兒去做一台心臟搭橋手術的。”

在PingCAP的聯合創始人及CTO黃東旭看來,企業級數據庫作為一個基礎軟件,應該是要用户“省心,放心,不擔心”。

“一個真正的企業級數據庫廠商應該把自己放在用户的角度去思考,無論是一個企業去購買數據庫應對數字化挑戰,還是一個工程師去面對數百台的數據庫集羣維護。”

因此,TiDB在誕生之初,就有一個目標:讓TiDB能夠滿足用户的所有的需求。

正如開篇所提,隨着企業數字化轉型進程加快,企業對於業務數據正呈現出“海量、實時、在線”的趨勢,在此背景之下,HTAP成為了數據庫領域的重要發展趨勢。

這裏需要科普的是,HTAP(Hybrid Transactional/Analytical Processing)即混合事務 / 分析處理數據庫能夠在一份數據源上同時支撐在線事務處理(OLTP)和在線分析處理(OLAP)場景,避免了傳統架構中在線與離線數據庫之間大量的數據交互。

為了滿足用户所需,TiDB 早在 1.0 版本就實現了 OLTP Scale(在線事務處理的規模化擴展),4.0 版本已經實現初步的 HTAP 能力,最新發布的5.0 版本在原有 HTAP 引擎 TiFlash 的基礎上引入 MPP 架構,提供與存儲匹配的分佈式計算引擎,進一步提升海量數據下的並行計算與分析能力。

並通過與 TiDB-Server 共享 SQL 前端,實現解析器(Parser)和優化器的共享,TiDB 向業務提供一體化的入口,能夠自動選擇單機執行或 MPP 模式,並且將事務型和分析型的負載隔離,使得雙方在高併發量壓力下互不干擾。

此外,TiDB 5.0 基於分佈式架構,支持雲原生與多雲,可以彈性擴展吞吐或存儲,輕鬆應對高併發、海量數據場景,實現一棧式數據服務。企業級用户和互聯網用户都可以通過一套 TiDB 系統構建數字場景應用,而不必關注底層架構。

而在性能方面,TiDB 5.0通過提供聚簇索引、異步提交事務、TiFlash MPP 等功能, 在 Sysbench 和 TPC-C 等 OLTP 基準測試中,獲得均值 50% 的性能提升。TiFlash MPP 在 OLAP 方面更是獲得了同等配置下數倍於 GreenPlum 的性能優勢。

讓用户“省心”顯然做到了,但下一個問題也隨之而來。

如何讓用户更放心?

當前,數據安全問題,成為了企業用户的最為關心的問題,對於數據庫產品,其穩定可用性也是至關的重要的。

據黃東旭介紹:TiDB 在設計之初便確定了成為企業級數據庫的目標,其「分佈式強一致性事務、在線彈性水平擴展、故障自恢復的高可用、跨數據中心多活」的技術架構,決定了它具備企業級核心數據庫需要的關鍵特性。

同時,TiDB 5.0 通過優化調度過程中對  I/O、網絡、CPU、內存等資源的佔用,大幅減少因為資源被搶佔而出現的QPS(每秒查詢量)性能抖動問題,在 TPC-C OLTP 的基準測試中,衡量 TPC-C tpmC 抖動標準差的值小於等於 2%。

如果這些數據,讓你無法瞭解TiDB5.0的穩定性如何的話,下面的表述,可能就會讓你對其有了一個深刻的認識。

據黃東旭介紹,在TiDB4.0版本的時候,越來越多的,不管是金融機構還是其它企業,開始把TiDB用在一些非常關鍵、非常核心的,包括一些交易、支付這種非常重要的場景裏面。

而我們也不妨將這些企業羅列一下:包括中國銀行、光大銀行、浦發銀行、浙商銀行、北京銀行、微眾銀行、億聯銀行、中國銀聯、中國人壽、平安人壽、陸金所、中國移動、中國聯通、中國電信、中體駿彩、國家電網、理想汽車、小鵬汽車、VIVO、OPPO、百勝中國、中國郵政、順豐速運、中通快遞、騰訊、美團、京東、拼多多、小米、新浪微博、58同城、360、知乎、愛奇藝、嗶哩嗶哩、Square(美國)、Dailymotion(法國)、Shopee(新加坡)、ZaloPay(越南)、BookMyShow(印度)在內,TiDB 已在全球超過 1500 家頭部企業的生產環境中得到應用。

國產數據庫正在走向超融合

“TiDB是一款我們從零開始,每一行代碼,都是我們自己寫出來的新一代的分佈式數據庫,核心代碼(自主可控率)是100%。”

對於為什麼不基於MySQL或者PostgreSQL開源進行開發,黃東旭對雷鋒網表示到:“基於開源代碼來開發,剛開始確實會比較容易一下,但是MySQL社區已經發展了二十餘年,想要把每一行代碼都弄明白也是一件不容易的事情。“

不僅不基於開源,PingCAP在成立之初還將開源作為核心戰略,其這背後的考量,是希望TiDB能夠擁有一個高度開放的用户生態。

在黃東旭看來,TiDB經過幾年的努力,已經跨越了開源軟件的鴻溝理論。

並且高度活躍的開源社區為 TiDB 產品發展帶來了飛輪效應,目前 TiDB 的研發能力、工程質量、迭代速度都已處於世界領先水平。

除此之外,在兼容性方面,TiDB 還是一個生態友好型的數據庫,TiDB 5.0 集成了更豐富的大數據生態,新增 Kafka 連接器 、支持 S3 存儲服務,並提供多個數據遷移、導入與共享組件,方便用户在自己的異構環境使用 TiDB。

據雷鋒網觀察到,目前,國產數據庫正呈現出底層多模多引擎的融合,開發者接口的融合,軟硬一體交付以及全鏈路生態的融合的趨勢。

在黃東旭看來,目前國產數據庫雖然相比於Oracle數據庫依舊存在着不小的差距。但隨着PingCAP不斷修煉內功,TiDB 5.0已經是一款可以讓用户“省心、放心、不擔心”的數據庫產品了,並具備完整的 HTAP 能力,用户業務無論是事務型還是分析型,只要一套 TiDB 系統就可以應對數字化轉型過程中“海量、實時、在線”的業務需求。(雷鋒網)

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2524 字。

轉載請註明: 分佈式數據庫進入實時時代,PingCAP 的選擇 - 楠木軒