作者:王與桐、小希
編輯:石亞瓊
**
2016年3月5日,北京天氣晴。上午10點,在一間長十米,寬三米的屋子裏,幾個身穿格子衫的程序員,開始對着一面白板交流。
這是PingCAP第一次 Infra Meetup。這幾個人中,有近10個來自PingCAP的創始團隊,唯二的客人,分別是來自華為和京東的開源愛好者。主人比客人多,倒也可以理解,畢竟週六上午的正確打開方式應該是“補覺”。
如今,以交流國內外基礎架構技術為主題的Infra Meetup,已經舉行了一百三十多期。PingCAP也成為今天成為中國最大的開源社區之一。作為底層軟件的公司,PingCAP獨立研發的數據庫產品TiDB,在 GitHub (世界上流行的開源代碼託管平台)共計獲得超過 25000的標星,集合了近 1200位貢獻者(Contributors);在世界範圍內,TiDB也是基礎架構領域的知名開源項目。
但創始團隊的野心卻遠不止於此,CEO劉奇説:“我們還是要專注TiDB這一款產品,希望可以做到 500 億美元的市值,而這背後需要 10 億美元量級的營收支持。”
01商業化:上百付費客户,300%營收增速500億美元市值是什麼概念?Oracle市值1700億美元,Snowflake市值700億美元。如果要要做到500億市值,需要10億美元量級的營收支持。如何去做營收呢?
對於開源軟件,所有人都關心的首要問題就是:免費的開源產品,能賺到錢嗎?
先説答案:能。
目前,PingCAP已經是中國開源軟件領域營收最高的公司,公司已經有超過 1500 家用户將 TiDB 用於線上生產環境,國內的客單價在百萬元量級,國外更是數倍之高。
中國的開源仍在發展的早期階段,大部分開源廠商尚未開始進行商業化嘗試。PingCAP的商業化跑通讓更多的國內的開源公司獲得了更快速的發展。在開源領域,頭部美元基金也在積極佈局,比如經緯在近幾年也投資了PingCAP、Nebula等很多開源公司。
PingCAP在產品研發前兩年也沒有營收,但是在開啓商業化後,PingCAP已經有過百家付費客户,營收增速平均保持在 300%。PingCAP告訴36氪,低獲客成本、高留存、高增購、比傳統軟件公司強大的銷售效率以及產品化迭代的加速度,是PingCAP保持高速增長的重要原因。
大多數商業開源軟件的商業化途徑是:首先提供免費版本軟件,後期再對高級功能或服務收費。源代碼可供所有人查看和使用,因此許多潛在客户的開發人員也會基於開源產品做項目,使核心產品更有用、更有價值。這也是開源模式最大的優勢,也因此在被採用時遇到的阻力很小。
但其難點也很明顯:開源軟件可能需要數年時間才能開發成功;開源軟件口碑比傳統的市場營銷手段重要,因此,收集關於迭代產品的反饋需要花費一定時間;開源用户和付費用户之間的鴻溝非常大,畢竟從“向所有人開放的免費協作項目”到“只向付費用户開放的商業產品”並不容易。
因此,開源軟件獲取商業客户信任的最佳方式是完全透明,提前規劃功能,並在社區探討。總結而言,就是借力“開源社區”,做到開源項目和社區的高度匹配。
那麼開源商業化,在付費意願更低、數字化意識薄弱的中國是如何實現的?
與國外模式對比,PingCAP也具備基於開源社區進行傳播,和明確付費、免費功能的兩大優勢。
首先,PingCAP 基於開源社區,可以實現一傳十、十傳百的獲客。
開源天然有着與toC一樣的的病毒式傳播能力,在工程師社區裏,用的不爽的工程師會反饋並提供解決方式;產品質量越好,推廣人越多,問題解決越快,正向循環就越快。這比傳統軟件通過銷售挨家挨户的敲門方式相比,效率高出太多。
再來看PingCAP是如何明確免費功能和付費功能的。
與紅帽等第一代開源軟件以支持服務為主的商業模式不同,PingCAP屬於三代產品,除了服務、Hybrid-Licensing的同時,也可以按照SaaS模式付費。
軟件獲客方式流程分為幾步:聽説-研究-測試-上線-維護,開源就是漏斗的源頭。
開源是商業化的漏斗的源頭,圖片來源:A16Z
而在這一漏斗中,又天然包含了開源相比傳統SaaS的優勢:獲客效率高、成本低。
第一,在“聽説”階段,開源就因為能夠看到源代碼,能更容易獲得信任。
第二,在“研究”階段,客户在採用傳統SaaS服務時,需要對比和選型,但開源產品的質量可以研究源代碼,也有很多社區用户現成的測試報告作參考,節省客户和廠商雙方的時間。
第三,客户“測試”、“上線”過程中遇到問題時,開源有很多開發人員可以提供幫助,但是在閉源的狀態下,只能由廠商去解決。
第四,開源社區的模式,天然對“運維”階段非常友好。
第一次付費在上線階段發生,即購買TiDB的服務。在國內市場,選擇在這一階段就付費的公司往往是金融機構;少部分互聯網公司也會在這一階段付費,比如蓋婭互娛、餓了麼等。
另外,TiDB是標準的OLTP(聯機事務處理)型數據庫,承載的都是諸如銀行核心系統等關鍵生產業務,這類關鍵業務需要極高的業務連續性要求(SLA),因此對原廠商業支持幾乎是剛需,這也是PingCAP開源用户轉化率和客單價雙高的重要原因。
最後,PingCAP在中國土壤上的差異點是,找準了客户羣:互聯網企業和金融企業。
互聯網企業是PingCAP的早期目標客户,一是因為早期開源愛好者往往都就職於互聯網公司,二是因為TiDB存儲、計算分離的架構設計,能夠讓用户按需擴容縮容,契合業務快速增長的互聯網公司的業務需求。
PingCAP第一單付費客户也是互聯網公司。2016年8月,遊戲公司蓋婭互娛向還沒有商業化想法的PingCAP提出測試邀請。當時蓋婭互娛有一個在線數據庫系統,主要用於廣告投放的分析,需要實時看到廣告投放結果,隨着業務的高速增長,系統已經達到瓶頸,迫切需要改造。
TiDB 的定位恰好能比較完美的解決這個痛點,只需要擴容,不必改造現有業務。但當時的TiDB還不夠穩定,處在“能看”到“能用”的轉化階段,因此內部對於蓋婭互娛的測試邀請比較慌張。“我們當時太不接地氣了,連個中文説明書都沒有。”劉奇回憶道。
真正上線也充滿了波折。第一次上線時間是凌晨五點,但是並沒有成功。蓋婭互娛還不斷鼓勵PingCAP,讓他們找到原因。隔了一天,TiDB又一次上線,跌跌撞撞終於成功了。
之後,互聯網企業成為PingCAP的客户來源之一。2020 年 6 月,PingCAP 發佈了 TiDB Cloud 產品,依託於公有云提供開箱即用的 TiDB 雲數據庫託管服務。藉助於雲,TiDB Cloud 可以通過水平擴展,擁有近乎無限的存儲容量和計算能力,使用户可以專注在自身業務的快速增長。
比起收入,PingCAP 選擇互聯網行業切入的更重要的理由是:中國很多互聯網公司的應用場景實際上非常有價值和挑戰,很多場景都做到了全球第一,這是中國獨有優勢,在服務這些頂級的場景的過程中不斷的打磨產品和業務共同成長。
選擇金融行業的原因並不複雜,金融行業正處於數字化轉型的關鍵窗口期,既有核心業務系統遷移改造等穩態場景的時間窗口,又有大量互聯網業務等 TiDB 十分擅長的敏態場景,另外金融行業付費意願較高。金融行業淨利潤佔國內上市公司的70%,這也差不多是金融行業佔PingCAP國內營收的比重。
當然,金融行業對於安全性、可用性的要求也更高。服務金融行業時難免會和阿里、華為等大廠短兵相接,但在劉奇看來,他們雖然綜合能力強、業務線廣,但在單點上面的投入或許並不大,此外,考慮到系統的中立性,大多數的CIO、CTO都不願被單一大廠鎖定。
因此,在拿下行業頭部的標杆客户後,PingCAP的金融之路就會順暢很多,目前已經服務了包括中國銀行、光大銀行、浦發銀行、浙商銀行、北京銀行、微眾銀行、中國人壽、平安人壽、國泰君安、華泰證券、陸金所等數十家金融機構。
總結而言,PingCAP的開源商業化在中國得以實現,一是基於開源社區高效傳播的優勢,二是相對傳統軟件,效率高、成本低,更適應當下的場景需求,三是選對行業,通過互聯網行業切入,高速打磨和迭代產品,找對時機然後輻射到其它行業。
02國際化:海外營收已超國內知道了如何賺錢,下一步就是要明確能賺多少錢,即回答“最好的市場”的問題。
市場規模決定了公司的天花板,決定了公司能講一個多大的故事,我們以數據庫行業內市佔率最高的Oracle為例。在PingCAP剛成立的2015年,Oracle在中國數據庫市場的佔有率高達56%,一騎絕塵。
Oracle最大的市場在美國。這也符合全球任何軟件現狀,Oracle也好,Salesforce也好,Snowflake也好,美國市場營收基本能佔到全球營收的一半。
據瞭解,中國市場佔Oracle全球總營收不到5%。這背後的邏輯是,中國市場對於數據庫有着大量的需求,但同時,中國客户因為人力成本、付費習慣及付費能力方面的客觀原因,並不能很好的支撐一個全球化數據庫公司在商業上的的高速成長訴求。
另一方面,海外市場也在進一步增大。作為PingCAP最早及最大的機構投資人,經緯中國的合夥人熊飛認為,對於海外市場,雲的普及也讓給開源基礎軟件的商業化帶來的新的思路,比起傳統的軟件售賣模式,在雲上提供服務無疑是更高效的,由於雲基礎設施的高度的標準化和自動化,同時加上 Pay-as-you-go 這樣對用户來説更友好的付費和租用模式, 對於數據庫這類高度標準化的軟件產品,依託於雲的基礎設施是獲取規模化收入的重要途徑。
在摩根士丹利的一份報告中,關係型數據庫的市場將在2024年達到250億美元,而PingCAP這種依託於公有云的新型關係型數據庫,到2024年的份額將佔到46%,比2019年上升19%。
也就是説,中國市場合適早期積累產品場景和方案需求,不斷打磨技術和服務能力,海外市場適合在解決方案成熟後,用來盈利。
這也是PingCAP的策略。
經歷了移動互聯網和金融、物流各行各業的數字化轉型的中國,已經培養了基礎軟件領域最豐富且具有挑戰性的眾多場景:美團是全球最大的外賣交易平台;四通一達是全球頂尖的物流公司;貝殼是全球最大的房屋交易平台……服務好他們,就代表着具備了服務同類海外公司的能力。
於是,從2019年服務Shopee開始,PingCAP走向了海外市場。目前海外市場的營收已經超過PingCAP國內營收,在不同的國家都有頭部的客户,比如日本最大的在線支付公司 PayPay, 美國的Square,越南的獨角獸VNG, 印度的 Zomato,東南亞最大的電商Shopee,法國最大的在線視頻公司Dailymotion等等。
中國市場不夠大固然是全球化的原因之一。另一方面,從最好的產品角度出發,好的產品就應該通行全球。所以PingCAP成立第一天,就把國際化當標配去做。
目前,PingCAP有來自 Google、Twitter、Square等公司,超過 300 的海外社區貢獻者。公司通過參加CNCF組織的活動,以及發佈前沿技術爆款文章在Hacker News、Dzone等媒體,吸引對TiDB感興趣的技術大咖。最終,很多人會沉澱在一些職業社交平台,比如Slack或者社區裏面的興趣小組,孵化出一系列潛在的商機線索。
PingCAP海外的支持者分佈,圖片來源:PingCAP
03產品:分離架構,為企業降低75%的人力成本開源商業化行得通的基礎,還是產品。
在2015年,諮詢公司Gartner預測,商業數據庫市場容量到2021年將會衰減到220億美元左右。快速發展的雲技術和硬件技術,以及快速普及的開源數據庫技術,將共同分裂商業數據庫領域。
與此同時,學術界在分佈式技術上也出現了一些突破性進展。這給在2015年開始創業的劉奇、黃東旭、崔秋三人提供了理論基礎。
一款新型的數據庫產品的研發週期註定很長,有耐心的資本可以幫PingCAP度過青黃不接的研發期。經緯中國合夥人熊飛在看了幾年企業服務後,意識到基於底層架構的創業將是下一波浪潮。在經緯北京的4號會議室,甚至連BP是什麼都不知道的劉奇帶着東旭、崔秋,和熊飛聊了快三個小時。 熊飛很快做了投資的決定。
讓用户簡易地操作和使用數據庫,是TiDB產品設計的核心理念。用户需求明確,想要一款自動彈性伸縮,能解決分庫分表(為了解決由於數據量過大而導致性能降低的問題,將原來獨立的數據庫拆分成若干數據庫)問題的數據庫。
為了控制規模和複雜度,TiDB將計算、存儲分層,一層是計算層SQL,它的特點是語言簡潔,非計算機專業人的可用。另一層是存儲的key-value層。
離用户越近越能更快得到用户的反饋,更快驗證想法是否可行,因此,團隊最終選擇從SQL層開始的順序。
如何替換原先的數據庫也是一個巨大的挑戰。用户習慣具有慣性,切換時也有各種要素考慮。2016年,單機版的MySQL仍然是主流,團隊在調研後發現,用户不敢馬上切換到新的產品,是擔心數據丟失等問題發生。
在不斷迭代中,TiDB也明確了自己的切入點:把分佈式理論和傳統關係數據庫相融合,兼容MySQL 協議和生態,應用無需或者修改少量,即可從MySQL 遷移到TiDB。
不過PingCAP並不滿足於在小數據量下取代MySQL,服務數據大規模增長的企業,才是新型分佈式數據相比於單機MySQL的最大變革。TiDB 存儲、計算分離的架構的設計,讓用户可按需對計算、存儲分別進行在線擴容或者縮容,並且讓整個過程中對應用運維人員透明。
兩年後,TiDB才推向市場,開始商業化。正如前文所説,TiDB早期的兩個標杆客户餓了麼和摩拜的痛點也都是業務在狂飆,但數據庫擴展與運維跟不上,而通過靈活的增減節點,TiDB幫助客户實現業務大規模增長下,數據庫的性能提升和平穩升級。
挑戰完“大傢伙”,TiDB也積累了豐富的場景經驗,像伴魚這樣新一代的客户則選擇All in TiDB,不僅能夠解決痛點,也節約了人力。傳統企業中,每條業務線底層都需要一組人力去做支撐,目前基於 TiDB 構建的數據底層,伴魚僅一套支撐服務團隊,就支撐了全公四條司產品、業務線,提高了業務研發和 DBA 的工作效率,降低了將近 75% 的人力開銷成本。
隨着產品、商業模式、市場的答案逐步明晰,資本對於PingCAP也越來越看好:PingCAP於2015 年獲得經緯中國領投的天使輪融資;之後每年都會有新的資本重注;2020年11月17日,PingCAP完成 2.7 億美元的 D 輪融資,由GGV Capital、Access Technology Ventures、晨曦投資、時代資本、五源資本(原晨興資本)共同領投,老股東經緯中國、雲啓資本繼續加持。
這點陪伴PingCAP成長的投資人看在眼裏,經緯中國的創始管理合夥人張穎也經常提醒公司:要注意現金流、要變現、要堅持探索商業化;劉奇本人則覺得PingCAP不夠接地氣,所以在商業化方面,他一定要補齊相關的銷售人才來彌補自己的短板。
04開源社區:實際參與的貢獻者已經近 1200人站在此刻看PingCAP的五年,產品、商業模式、市場、資本的補齊,都離不開一個關鍵詞——開源。
可以説,“開源”是PingCAP 走到現在的源動力。
與開源精神類似的事務並不少見。在特定範圍內,開源軟件的源代碼任何人都可以審查、修改和增強,類似於全人類都可以編輯的百科全書Wikipedia。一個開源項目,無論是阿里、美團,全球任何一家企業的工程師,都可以去參與研發,提交代碼,並且使用共同研發的產品。
另一個對開源的著名類比就是集市的模式。在開源著作《大教堂和集市》中,IT界傳奇人物Eric Raymond表示,世界上的建築可以分兩種:開源軟件是集市,天天開放在那裏,從無到有,從小到大;傳統軟件則是大教堂,需要幾代人嘔心瀝血才能建成並投入使用。
這樣類比原因是,集市模式讓更多的工程師參與到軟件的開發過程,提高軟件質量,完善自身產品並支持自己的服務。
保持開源社區的活力是TiDB變得更好用的關鍵,也是實現正向產品循環、商業循環的關鍵。目前,TiDB實際參與的貢獻者已經近 1200人,通過社區槓桿去撬動優秀人才是開源力量的強大之處。
而如何運營開源社區?PingCAP有一套自己的方法論,劉奇認為就像運營抖音、知乎等內容社區一樣。
第一,先要找到最有能力的貢獻者形成產品原型,逐漸的細化分工,最終形成加速的循環。
在最開始兩年,TiDB並不是一個拿來即用的狀態,PingCAP自身團隊會對某一模塊有一些構思,然後通過週六早上的Infra MeetuP 把TiDB社區裏對開源最忠誠、最狂熱的幾個專家集合起來打磨產品,形成一個產品“毛坯”。
隨着貢獻者越來越多,分工也會更細緻,也會讓模塊的搭建速度也越來越快。當產品開始進入企業應用,就可以從企業收集到更多反饋,從而迭代改進產品,這就進入了一個大循環。在2018年到2019年,大循環完全啓動後,迭代速度也越來越快。“我們真正高速跑起來不過兩年。”劉奇認為,這就是開源社區厚積薄發的體現。
第二,設置反饋和激勵機制,讓每一位貢獻者感受到尊重和認同的同時,傳播社區的能量。
TiDB社區將貢獻者分為幾個等級:Contributor—Committer—Maitainer,就像升級打怪一樣獲得成就認證勳章。 很多社區貢獻者的代碼大多是基於俠義精神的分享,不是每個人都能得到金錢上的回報。舉個例子:有些開發者,他們追求的是極客精神和完美主義,在使用開源產品時,會主動的去改進 BUG 或者增加新的功能;有些是希望通過分享、幫助別人,從而獲得成就感。
PingCAP還會設計一些非常有趣的周邊來證明身份,比如標誌性的紅色馬克杯就必須是貢獻者才能有。發放標準非常嚴格,PingCAP的A輪領投方雲啓資本董事總經理陳昱,也在TiDB上貢獻過一些代碼,拿到了紅色馬克杯。
第三,定期舉辦有技術影響力和深入用户的活動。
疫情前,線下Hackathon是PingCAP會定期舉辦的活動。在Hackathon期間,工程師會進入到瘋狂Hack-吃飯-瘋狂Hack-吃飯的模式中寫代碼到凌晨。
開源活動中,圖片來源:PingCAP
另一件震動技術圈的大事,就是48小時寫一本關於TiDB的技術書籍,一本涵蓋TiDB架構原理、最佳實踐案例、生態發展的作品誕生,兩天內總計產生421次Commit,199個PR。
這些聽起來瘋狂的舉動,其實並不難理解。回到本文開頭的場景,PingCAP通過篩選到了一批開源狂熱愛好者,在回饋社區的同時,也形成了 PingCAP的人才護城河。
而最根本的根本,是要回答一個問題:開源為什麼會被追捧?
企業軟件行業的發家基礎,是平台與開發者。而開源軟件天然對開發者友好:全球有數千萬開發者使用開源平台訪問代碼、修補應用程序、促成項目、參與社區。
圖片來源A16Z
就像硅谷風投A16Z説得那樣,開源吞噬一切。上圖所統計的是1988~2018年開源領域的融資數量及融資規模:200 家把開源作為核心技術的公司,總體融資規模超過 100 億美元,且近十年來融資數額越來越大。
未來,開源項目將只增不減。開源不再只是 RedHat、Elastic、Databricks 與 Cloudera,它還將是 Facebook、Airbnb、Google 以及其他任何以開源為核心技術棧的商業公司。開源軟件的市場及其可能性,要遠遠超過目前的想象。
希望縱然存在,但問題也很現實:開源社區的商業化在不同領域可不可複製?市場的天花板在哪裏?這個市場可以容納幾家相似的公司?Snowflake至今還在虧損,那這類公司到底何時才能盈利?雖然基於公有云的關係型數據庫發展極快(2024將佔到46%的份額),但是中國企業雲化進程滯後,這是否會影響相關企業的增速?
時間將給出答案。