楠木軒

從FY21Q1財報看Cloudera的轉型之路

由 睢風娥 發佈於 科技

圖片來源@視覺中國

文 | 郭華

今年六月距去年六月正好一年。

去年六月,Cloudera發了FY20Q1財報,營收以微小差值不及分析師預期,股價當天跌去40%。

今年六月,Cloudera發了FY21Q1財報,對比去年,營收增長12%,利潤增長44%,大客户和訂閲服務佔比也穩定增長,均超分析師預期,於是股價一路上漲,疫情中逆勢重回高地。

從股價來看,Cloudera這一年的表現就像坐了一次過山車,不過解讀財報非我所願,對趨勢做技術分析更非我所擅長,只是對於這個現象,我有些關於“基本面”的話想説一説。

去年六月,在Cloudera股價暴跌的時候,大家找到了三個問題:

1) Cloudera所賴以生存的Hadoop氣數已盡;

2) Cloudera公司合併了Hortonworks,兩者的產品線不同,整合困難;

3) Cloudera在雲時代毫無作為,已被拋棄;

這三個問題在程度上雖然有誇張的成分,但不完全是空穴來風,關注點也非常準確。所以所謂的“基本面”,其實就是看看Cloudera到底把它們解決掉了沒有。

1. Hadoop已死,Hadoop長存

很早的時候,大概比Cloudera股價暴跌2019年還早那麼五六年,很多人便開始宣稱Hadoop已死,Spark出來後Hadoop已死,Elasticsearch出來後Hadoop已死,甚至MongoDB出來後Hadoop也已死。

作為一個2011年開始接觸Hadoop,並至今還賴以為生的IT中年,我對Hadoop已死的論調十分不感冒。實際上只需幾個問題便能停止這種毫無根據的假想:有幾家公司做大數據不用Hadoop?Hadoop是否有替代方案?如果有的話,難度是不是小於Elasticsearch或Spark或Mongo或其他?

我更能接受的一種説法是,Hadoop裏某些組件已經有了的替代品,比如Spark、Flink 之於 MapReduce,雲存儲之於HDFS,K8S之於YARN。而且我認為比起Hadoop已死的暴力論斷,這種説法更為實際,也更值得Cloudera擔心。

那Cloudera是怎麼解決這個問題的?

他沒有解決。

真的,他沒有反駁和抗拒技術本身的衰落,反而承認了這一點。他説技術就是不停的處於打破與被打破的循環之中,而他們要做的是把Hadoop發展成一個生態,讓那些更先進的技術,最終成為這個生態的一部分,老的如Hive、Hbase,新的像Spark、Flink,現在都是Hadoop生態的一部分,總體不下40個。

就像一片森林,局部有枯萎有新生,但整體看斗轉星移,生生不息。

借用他們的一張PPT來看,大概是下邊這樣。

圖片來自Cloudera大中華區總經理徐晉在InfoQ的分享

這是一種擁抱變化的哲學。

如果這樣看的話,你不得不承認Hadoop反而有比其他開源軟件更強的生命力。因為雖然大家都有意無意在朝這個方向努力,比如Elasticsearch上的ELK、Kafka上的KSQL和Kafka Streams,但能做成一個生態的,目前看,恐怕只有Hadoop。

而且從另一方面來看,很多廠商提供的Hadoop部分替換方案也無一例外會兼容Hadoop接口,所以哪怕Hadoop自身所有軟件都衰落了,被完全替換了,Hadoop也能作為一種標準繼續存在。

Hadoop已死,Hadoop長存。

2. Cloudera產品線合併

全新的Cloudera由老的Cloudera和Hortonworks合併而來。

在合併之前,兩者的產品雖然都基於Hadoop,但理念和具體組件並不一致。Cloudera的產品叫CDH,採取了Open Core+閉源組件的商業模式,在開源Hadoop上加了一些自研產品,比如管控平台。Hortonworks的產品叫HDP,組件和商業模式都採取了全開源的模式。

所以合併後的第一大問題就是產品策略的問題。

為此,Cloudera做了大刀闊斧的改革。

一方面,Cloudera保持對原CDH和HDP的支持直到2022年,給客户一個平滑的過渡期。另一方面,Cloudera也推出了整合性的新產品,並且孤注一擲的表示2022年以後,全部客户都會轉移到這個產品上來。

這個新產品便是CDP。

CDP全稱為Cloudera Data Platform。按照Cloudera CPO Arun Murthy的説法,CDP會在CDH6和HDP3的基礎上進行整合,把兩條產品線裏最好的組件拿出來,在保證兼容性的前提下,給客户更好的體驗。

在這個基礎上,Cloudera也改變了自己的商業模式。

2019年7月,Cloudera發表了一篇文章,題為《我們對開源的承諾》,表示會把原來的閉源組件全部開源,比如Cloudera Manager,Cloudera Navigator和Cloudera Data Science Workbench(“CDSW”)等,而且這個決定在所有新發版本上全部有效,包括老的CDH、HDP和CDP。

該決定的執行期為6個月,現在已完成。

現在Cloudera把所有產品都託管到了Apache基金會,在AGPL 和 Apache 2.0 兩種許可下進行開源,並以訂閲的形式向客户收取軟件和服務費用。

這是Cloudera新商業模式,也是紅帽的商業模式。早在2013年的時候,Cloudera的第一任CEO Mike Olson就曾表示,雖然開源軟件蓬勃發展,但其背後的商業公司卻難以獨立生存,要麼消失要麼被收購,比如IIIustra、Informix、Sleepycat、Mysql、SpringSource、JBoss……實際成功的只有一家,就是紅帽。

所以並不意外。

那效果怎麼樣?

從FY21Q1財報來看,訂閲服務收入1.871億美元,佔總體的89%,同比增長21%,超過總體增幅,同時毛利率也提高到了85%。這意味着訂閲服務已經成了其營收的主力,而且在帶動整體向上突破。

與此同時,Cloudera的客户數也在增加。

FY20Q2的財報中, Cloudera的大客户(年化經常性收入大於10萬美金)數增長了24個,達到953個。而到了FY21Q1的財報,這個數字已經到了1004。要知道一年前Cloudera的暴跌就和客户數有關,在FY20Q1的財報電話會議上前 CEO Tom Reilly曾親口承認產品線的分歧影響了客户拓展,確實某些客户因為等待產品線的整合而推遲了續費。

所以從這兩點看,Cloudera在產品線上的整合可以説是成功了。

3. 與雲共生

過去的一年是Cloudera在雲計算上猛追猛趕的一年。

北宋有位“半部論語治天下”的名相趙普,在宋太宗趙匡義繼位時,他曾上書説,“中國既安,羣夷自服。是故夫欲攘外者,必先安內。” 自此以後,“攘外必先安內”就流傳了下來,成了歷代統治者面臨內憂外患時的首選策略,直到九一八事變後,還在被國民政府反覆強調。

這句話用來形容Cloudera或許也是貼切的。

因為Hadoop社區之前一直在內戰。Hadoop萌芽自Doug Cutting個人,但成長於雅虎。在Hadoop基礎上,有兩家主要開源獨立開源商業公司,就是Cloudera和Hortonworks,兩家在開源社區的貢獻幾乎相當,雙方不僅在爭奪市場,也在爭奪開源Hadoop的控制權。這種分裂牽扯了太多精力,以至於一不注意就讓雲廠商直接用開源Hadoop收割掉了大部分企業上雲的紅利。

所以有這樣一種魔幻般的現實,一邊是Hadoop已死,一邊是各大雲廠商拿Hadoop瘋狂賺錢。據分析師測算,單2018年AWS的EMR就產生了2.5億美金的營收,而該產品介紹就是“Hosted Hadoop framework“。而這並不是孤例,除AWS的EMR外,谷歌雲有Dataproc,Azure有HDInsight,阿里雲有E-MapReduce,雲計算四巨頭,在收割Hadoop開源紅利面前,無一缺席。

所以如果説產品線合併是內憂的話,那雲廠商就是外患了。

不過雲廠商並不是在針對Hadoop,雲只是在崛起,並在崛起之路上順帶吞噬了遇到的東西,不僅包括Hadoop,也包括其他開源軟件。

MongoDB 的 CEO這樣描述道:“每當一個新的開源項目變得非常流行時,雲提供商就會剝奪我們的技術,將免費軟件放在他們的平台上,然後從中獲取大部分(如果不是全部)價值,但幾乎不回饋開源社區”。

只要用户上了雲,那他幾乎只能選擇雲廠商提供的開源服務,而上雲恰恰是過去十年企業IT的主旋律。這讓開源原廠十分憤怒,Redis CEO 直言:“多年來,我們就像個傻子一樣,他們拿着我們開發的東西大賺了一筆”。

於是他們紛紛開始採取行動,一方面修改開源協議,禁止雲廠商提供託管服務(只針對部分組件有效),另一方面也在積極發展自己的獨立雲服務,比如Confluent的Confluent Cloud、Elastic的Elastic Cloud,以及Cloudera的CDP。

他們怒斥公共雲廠商為吸血鬼,而且準備以反壟斷名義提起訴訟。

不過好在雲廠商也不是鐵板一塊,比如谷歌就從中看到了超越AWS的機會。他旗幟鮮明的表示支持開源,並在2019年引入了7家開源軟件供應商,通過谷歌雲售賣他們的商業服務,準備打造一個Open Cloud。

大部分雲廠商都有一個MarketPlace可以售賣其他公司開發的軟件,而谷歌雲的特別之處在於,他引入的開源廠商都會有內部的團隊來對業績負責。比如引入Confluent(kafka)的就是谷歌自己的Pub/Sub產品團隊,兩者功能和場景上類似,只不過一個自研,一個開源。按照谷歌的説法,在同一個雲平台上提供這兩個產品,旨在“滿足用户的不同選擇傾向”。

在這種情況下,開源原廠的獨立雲服務變得實際起來,他們可以和不同的公共雲合作,在不同的雲上售賣自己的產品,同時維持獨立入口,與雲共生。

Cloudera的CDP也是如此。

CDP不僅是原CDH和HDP兩條產品線的結合體,也有支持多雲的共有云版本,同時也有私有云/混合雲等多種運行環境。

而且CDP的開發速度也十分快,2019年初公佈計劃,幾個月後產品發佈,目前已經完成了在AWS、Azure上的版本,谷歌雲版本下半年面市。實際上多雲不僅是Cloudera應對雲廠商威脅的手段,從客户的需求看,其本身也有不可替代的價值。隨着雲滲透率的提高,被雲綁定成了一個切實的擔憂,讓很多客户在上雲的同時尋找Plan B。比如把應用部署在多個雲服務商,或者自建機房。CDP就是這種需求下的產物,通過CDP,客户可以把自己的大數據服務部署到AWS、Azure或谷歌雲上,無縫切換,消除了被某個雲廠商綁定的問題。

而且Cloudera最近還推出了CDP私有云,在K8S基礎上把存儲和計算做了分離,讓客户應用可以在公有云與公有云,公有云和私有云之間無縫切換,構建一個“以數據為中心,面向多雲的私有云平台”。

短短一年時間,Cloudera以驚人的速度完成了一場蜕變,曾被人詬病在雲時代毫無作為的他,儼然看齊並領先起了潮流。

4. 總結

這便是Cloudera股價過山車背後的基本面,他孤注一擲的CDP不管從計劃還是執行上都表現的足夠亮眼,以一個產品解答了曾被人詬病的多個問題。從這個角度來看,可以説他轉型成功了,至少也走在了成功的路上。

再沒有人像去年那樣,用洋槍隊圍觀神拳義和團的姿態,詢問他將何去何從。

只是對他來説,過去的這一年似乎有些漫長。