分布式数据库进入实时时代,PingCAP 的选择

随着企业数字转型进程的加快,行业数字化场景也呈现出爆发式增长。

随之而来的就是海量的业务数据,以及实时、在线的数据分析的能力需求。这一趋势之下,传统集中式数据库、中间件、大数据等多组件协同的异构数据栈暴露出上线难、维护成本极高等问题,严重阻碍企业数字化进程。

因此,什么样的数据库才是一款真正的企业级数据库?成为了数据库从业者思考的重点。

什么才是企业数据库?

“没有人会没事儿去做一台心脏搭桥手术的。”

在PingCAP的联合创始人及CTO黄东旭看来,企业级数据库作为一个基础软件,应该是要用户“省心,放心,不担心”。

“一个真正的企业级数据库厂商应该把自己放在用户的角度去思考,无论是一个企业去购买数据库应对数字化挑战,还是一个工程师去面对数百台的数据库集群维护。”

因此,TiDB在诞生之初,就有一个目标:让TiDB能够满足用户的所有的需求。

正如开篇所提,随着企业数字化转型进程加快,企业对于业务数据正呈现出“海量、实时、在线”的趋势,在此背景之下,HTAP成为了数据库领域的重要发展趋势。

这里需要科普的是,HTAP(Hybrid Transactional/Analytical Processing)即混合事务 / 分析处理数据库能够在一份数据源上同时支撑在线事务处理(OLTP)和在线分析处理(OLAP)场景,避免了传统架构中在线与离线数据库之间大量的数据交互。

为了满足用户所需,TiDB 早在 1.0 版本就实现了 OLTP Scale(在线事务处理的规模化扩展),4.0 版本已经实现初步的 HTAP 能力,最新发布的5.0 版本在原有 HTAP 引擎 TiFlash 的基础上引入 MPP 架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。

并通过与 TiDB-Server 共享 SQL 前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或 MPP 模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。

此外,TiDB 5.0 基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户和互联网用户都可以通过一套 TiDB 系统构建数字场景应用,而不必关注底层架构。

而在性能方面,TiDB 5.0通过提供聚簇索引、异步提交事务、TiFlash MPP 等功能, 在 Sysbench 和 TPC-C 等 OLTP 基准测试中,获得均值 50% 的性能提升。TiFlash MPP 在 OLAP 方面更是获得了同等配置下数倍于 GreenPlum 的性能优势。

让用户“省心”显然做到了,但下一个问题也随之而来。

如何让用户更放心?

当前,数据安全问题,成为了企业用户的最为关心的问题,对于数据库产品,其稳定可用性也是至关的重要的。

据黄东旭介绍:TiDB 在设计之初便确定了成为企业级数据库的目标,其「分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活」的技术架构,决定了它具备企业级核心数据库需要的关键特性。

同时,TiDB 5.0 通过优化调度过程中对  I/O、网络、CPU、内存等资源的占用,大幅减少因为资源被抢占而出现的QPS(每秒查询量)性能抖动问题,在 TPC-C OLTP 的基准测试中,衡量 TPC-C tpmC 抖动标准差的值小于等于 2%。

如果这些数据,让你无法了解TiDB5.0的稳定性如何的话,下面的表述,可能就会让你对其有了一个深刻的认识。

据黄东旭介绍,在TiDB4.0版本的时候,越来越多的,不管是金融机构还是其它企业,开始把TiDB用在一些非常关键、非常核心的,包括一些交易、支付这种非常重要的场景里面。

而我们也不妨将这些企业罗列一下:包括中国银行、光大银行、浦发银行、浙商银行、北京银行、微众银行、亿联银行、中国银联、中国人寿、平安人寿、陆金所、中国移动、中国联通、中国电信、中体骏彩、国家电网、理想汽车、小鹏汽车、VIVO、OPPO、百胜中国、中国邮政、顺丰速运、中通快递、腾讯、美团、京东、拼多多、小米、新浪微博、58同城、360、知乎、爱奇艺、哔哩哔哩、Square(美国)、Dailymotion(法国)、Shopee(新加坡)、ZaloPay(越南)、BookMyShow(印度)在内,TiDB 已在全球超过 1500 家头部企业的生产环境中得到应用。

国产数据库正在走向超融合

“TiDB是一款我们从零开始,每一行代码,都是我们自己写出来的新一代的分布式数据库,核心代码(自主可控率)是100%。”

对于为什么不基于MySQL或者PostgreSQL开源进行开发,黄东旭对雷锋网表示到:“基于开源代码来开发,刚开始确实会比较容易一下,但是MySQL社区已经发展了二十余年,想要把每一行代码都弄明白也是一件不容易的事情。“

不仅不基于开源,PingCAP在成立之初还将开源作为核心战略,其这背后的考量,是希望TiDB能够拥有一个高度开放的用户生态。

在黄东旭看来,TiDB经过几年的努力,已经跨越了开源软件的鸿沟理论。

并且高度活跃的开源社区为 TiDB 产品发展带来了飞轮效应,目前 TiDB 的研发能力、工程质量、迭代速度都已处于世界领先水平。

除此之外,在兼容性方面,TiDB 还是一个生态友好型的数据库,TiDB 5.0 集成了更丰富的大数据生态,新增 Kafka 连接器 、支持 S3 存储服务,并提供多个数据迁移、导入与共享组件,方便用户在自己的异构环境使用 TiDB。

据雷锋网观察到,目前,国产数据库正呈现出底层多模多引擎的融合,开发者接口的融合,软硬一体交付以及全链路生态的融合的趋势。

在黄东旭看来,目前国产数据库虽然相比于Oracle数据库依旧存在着不小的差距。但随着PingCAP不断修炼内功,TiDB 5.0已经是一款可以让用户“省心、放心、不担心”的数据库产品了,并具备完整的 HTAP 能力,用户业务无论是事务型还是分析型,只要一套 TiDB 系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。(雷锋网)

版权声明:本文源自 网络, 于,由 楠木轩 整理发布,共 2524 字。

转载请注明: 分布式数据库进入实时时代,PingCAP 的选择 - 楠木轩