去“O”與開源長期並存下,國產數據庫如何乘風破浪?

  【IT168 專訪】疫情肆虐之下的2020年帶來了很多變數,讓所有人體會到了“難”。之前數據庫領域有人也談起了去“O”(Oracle數據庫)之難,國內提了十多年的去“IOE”,感覺現在對於去“O”依然是蜀道之難,難於上青天。

去“O”與開源長期並存下,國產數據庫如何乘風破浪?

  Oracle數據庫往往承載着企業關鍵業務系統,去留要看企業發展情況和戰略規劃,所謂難更多是一種謹慎。“因為’O‘不僅僅是去數據庫,還涉及到很多應用,如果過於絕對可能對客户現有的系統產生比較大的影響。”PG中文社區副主席唐成在接受IT168採訪時曾説。

  即將到來的5G時代數據井噴,海量數據對數據庫提出了新的需求也帶來了新的挑戰。這兩年,去“O”的呼聲越來越大,不少傳統企業開始脱離“IOE”的集中式架構,進行分佈式改造,邁向雲端。各個行業也出現了不少成功去“O”的案例,證明國產數據庫同樣可以支撐企業核心業務系統,讓大家對國產數據庫的未來增加了一份信心。

十年去“O”遠未到尾聲

  數據庫已經有40多年的發展歷史,早期由IOE構建起了封閉的集中式架構體系,以Oracle數據庫、SQL Server、DB2為主的商用關係型數據庫牢牢佔據着企業級數據庫市場。

  傳統的集中式架構在穩定性和可用性方面有天然的優勢,同時缺點也很明顯,擴展性差。互聯網以及大數據等新技術的發展,海量的數據的爆發使得垂直擴展的集中式架構面臨着挑戰,可彈性擴展的分佈式架構和雲端數據庫成為數據智能時代的新寵兒。從互聯網企業到傳統企業,逐漸開始了去“ O”之路,實際上更廣泛的説應該是國內企業面向未來依從其戰略規劃,而進行數據庫改造,由於很多都涉及到Oracle數據庫,去“O”也可算作調整的代稱。

  即便國內去“O”浪潮洶湧,從業者提起Oracle數據庫從未吝嗇過讚美之情。Oracle 相對其它數據庫,功能或者SQL優化器方面遙遙領先,這被視為阻礙去“ O”的難點之一,數據庫承載着企業比較重要的業務系統,尤其Oracle往往支撐着企業的核心複雜業務系統,企業替換時會更為謹慎,以Oracle為首的最早幾家霸主至今依然佔據着關係型數據庫市場的統治地位。

  在新基建的東風下,像TBase這樣的國產數據庫產品正乘風破浪。TBase是由騰訊數據平台團隊基於PostgreSQL 自主研發的企業級分佈式HTAP關係型數據庫,作為騰訊雲三大自研數據庫之一,採用Share-Nothing架構,集高擴展性、高SQL兼容度、分佈式事務支持、多級容災能力以及多維度資源隔離等能力於一身。TBase可適用於擁有海量數據、高併發、高吞吐,以及混合HTAP、要求分佈式事務能力的各種應用場景。

  “有些客户(去“O”)的需求特別高,不過畢竟Oracle也是老牌數據庫,所以要跨出去這一步還是很不容易的。” 10多年前曾在研究所參與核高基數據庫研究的騰訊雲TBase產品負責人黃琳認為國內真正去“O”大幕才剛剛拉開,“我一直都有一顆做強國產數據庫的心”。

  Oracle兼容性是衡量國產數據庫產品的一項重要指標,也是國內企業的重要關注點之一,

  “很多人也會説,做Oracle(兼容)是無底洞,一直在投入,就是做永遠也做不完。”黃琳如此介紹Oracle功能的強大,目前TBase Oracle兼容性度較高,支持標準的SQL2003標準,且具備分佈式存儲過程、視圖、觸發器等全面的SQL能力,在企業不願意對之前基於Oracle的業務進行大量改造的場景,TBase將是不錯的選擇。針對Oracle的兼容性問題,TBase的解決思路是優先從通用基礎能力入手,結合客户實際需求去逐步完善Oracle兼容性,現在已經做了近千項語法兼容。

  值得一提的是,TBase是基於PostgreSQL生態的數據庫,既有集中式形態也有分佈式形態。黃琳認為分佈式架構和雲雖然是未來大勢所趨,但是現在集中式場景還比較普遍存在,比如某些小企業或者業務比較單一的企業數據量不太高,併發需求不太明顯,傳統集中式OLTP可以勝任,團隊會推薦集中式版本,“不一定要走分佈式這條路,因為分佈式節點之間的這種協同,網絡開銷會有一定損耗。而對於海量數據使得單點存儲空間不足,高併發單機不能消化掉,客户對未來數據增長有預期,那麼分佈式高擴展這種能力都是有非常大的優勢,這時候我們會推薦客户用分佈式架構。”她強調分佈式並不會通吃所有場景,集中式和分佈式這兩條線會長期演進下去,企業要結合自己的業務和公司戰略綜合衡量再做決定。

  為了滿足企業的數據庫調整需求,未來TBase會不斷強化Oracle兼容性,騰訊雲也會不斷完善數據遷移工具等,比如6月18日,騰訊雲外發布了企業級數據庫遷移產品DBbridge,通過提供一站式數據遷移平台以及專家服務,幫助企業實現異構數據庫之間數據的遷移和同步。尤其在傳統數據庫遷移到分佈式數據庫場景下,DBbridge能夠有效降低數據遷移的成本和複雜性,滿足企業多樣化的數據傳輸、數據匯聚、數據災備等需求。

  而日前TBase進行了開源後首次重磅升級,發佈了最新開源版本,也引起了業內對數據庫開源問題的關注。

用開源探索數據庫未來

  開源數據庫的發展改變了數據庫市場,成為重要的力量。根據2018年Gartner發佈的相關報告,到2019年,OSDBMS(開源數據庫管理系統)在DBMS(數據庫管理系統)市場中的總支出份額超過10%以上,到2022年,超過70%的企業內用應用將會基於OSDBMS,50%的現有商業關係型數據庫系統將會被替換掉,或者正在計劃被替換掉。

  而從2018年開始,Redis Lab、MongoDB、Neo4j等多家開源數據庫修改許可協議,這被認為是開源數據庫阻止商業公司繼續吸血的舉動,開源數據庫似乎變了天。“這確實對整個開源界釋放出一個新的信號,也就是開源除了精神上的支柱,其實也需要商業化的支柱。可能商業化反而會助推其開源的發展。因為像MongoDB這樣的公司,其實還是需要商業回報,才能去推動開源的發展,其實這個趨勢現在是非常非常明顯的。”PostgreSQL中文社區主席趙振平在之前接受IT168採訪時指出。

  開源數據庫修改許可協議更多是基於商業方面的考量,而開源依然是對數據庫發展非常有益的商業模式探索,實際上國內外開發者對開源數據庫生態的熱情並沒有減少,國內廠商也在積極擁抱開源。

  去年11月TBase宣佈開源,今年6月,華為也正式宣佈開放openGauss數據庫源代碼。二者皆是基於基於PostgreSQL開發,團隊都堅持要來自開源回饋開源,不過二者開源有所不同,TBase開源的是分佈式版本,openGauss開源的只是單機版本。根據相關專家介紹PostgreSQL因其開放性和完善的生態,越來越受歡迎。而在過去的幾年中,PostgreSQL出現了大規模的普及和增長,DB-Engines顯示其受歡迎度在過去四年中翻了一番。

  相對於商業數據庫,開源生態更為開放,很多數據庫從業者都積極參與其中,企業選擇開源數據庫也有自己的考量,“TBase有開源,我懂PG,我就容易懂你(TBase),會上手很快。”不少客户都會對TBase團隊分享他們對開源的看重,黃琳介紹TBase開源生態的一個主要優勢就是不綁定客户,客户的正向反饋也給了團隊擁抱開源的決心和信心。

  7月13日,TBase發佈了最新開源版本,該版本在多活分佈式能力、性能、安全性、可維護性等多個關鍵領域得到全面的增強和升級,複雜查詢的性能提升十倍以上。截止目前,TBase在GitHub上的Star數已超過800個,Fork數近200。

  據騰訊雲TBase數據庫技術負責人李躍森介紹,最新發布的TBase開源版本具備強大的多活分佈式能力,並提供了發佈與訂閲層面一系列的新特性,可以幫助用户更高效地完成數據同步和快速定位錯誤。TBase開源新版本還採用全新的備機升主方式,新增了插件在線升級、鎖優化等多項新功能。未來TBase會繼續擁抱PostgreSQL生態,全面支持PostgreSQL上下游生態。“希望TBase成長為一個受歡迎、有能力、有擔當的一個國產數據庫品牌,為更多的客户服務。”黃琳説。據悉,TBase不僅在微信支付這類重要的內部業務中經受了單日請求量超10億次的考驗,也成功應用到政務、醫療、公安、消防、電信、金融等諸多行業的核心業務系統中。

  越來越多的國內數據庫產品選擇開源,證明國產數據庫已經有了可以走向世界的技術能力,將會為開源生態貢獻自己的經驗和力量,而不斷壯大的開源社區也會助力廠商數據庫產品不斷完善,這是一個持續正向增長的過程。不過目前中國開源數據庫生態相比與國外還有一定的差距,還在一個探索的階段。

  可以預見去“O”與開源仍然是接下來數據庫領域的重頭戲,大幕拉開,百花齊放。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 3589 字。

轉載請註明: 去“O”與開源長期並存下,國產數據庫如何乘風破浪? - 楠木軒