開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個廣告,點擊進來看看。  

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

Tom Reilly, chief executive officer of Cloudera Inc.

文|郭華

今年6月6日,Hadoop商業(yè)公司Cloudera突然暴跌了40%,一時間引發(fā)了大家激烈的討論,在這些討論之中,最具代表性的觀點便是Cloudera的暴跌代表著Hadoop的隕落。

但我認為Cloudera的暴跌與Hadoop無關。

健康的Hadoop

Hadoop現(xiàn)在還是非常健康的。

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

圖1 Hadoop大數(shù)據(jù)分析市場情況

首先,我們看一下Hadoop的市場情況,根據(jù)statista的測算,2019年全球Hadoop和大數(shù)據(jù)市場規(guī)模約在340億美金左右,且5年復合年增長率高達28.5%——從這點看,Hadoop沒有衰落的跡象。

其次,我們再看一下現(xiàn)在最火的云計算廠商的情況,打開他們的產(chǎn)品頁,我們看一看對大數(shù)據(jù)怎么想:

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

圖2 四大云廠商Hadoop情況

從圖2可以看到,不管是Amazon的EMR、谷歌的Dataproc還是阿里云的E-MapReduce和Azure的HDInsight,四大云廠商無一例外都選擇了Hadoop,而且均占據(jù)了其產(chǎn)品頁頭部的位置,這足以說明Hadoop在云廠商心目中的地位——從這點看,Hadoop也沒有衰落的跡象。

然后,我們再看一下Hadoop本身。
開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

圖3 Hadoop生態(tài) from oreilly.com

Hadoop從2006年發(fā)布以來,不僅點燃了大數(shù)據(jù)的熱火,自身也在熱火中逐漸發(fā)展壯大,從一個軟件變成了一個生態(tài)。在HDFS和YARN基礎上長出來一系列大名鼎鼎的軟件,這里邊既有老牌的Hive和Hbase,也有熱度正在攀升的Spark和Flink,總體接近四十多個,從實踐中看,Hadoop仍然是企業(yè)大數(shù)據(jù)處理系統(tǒng)最佳甚至唯一的選擇——從這點看,Hadoop也沒有衰落的跡象。

最后,我們再來看看招聘要求,就拿中國最頂尖的這部分公司為例,比如百度、阿里、騰訊、頭條、美團、滴滴、網(wǎng)易等,這些公司對大數(shù)據(jù)工程師的要求第一點便是Hadoop。看完這些JD,毫不夸張的說,如果你是候選人而只讓你選一門技術做準備,那一定是Hadoop——從這點看,Hadoop也沒有衰落的跡象。

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

圖4 各大公司招聘要求

說Hadoop衰落的人提了一些論點,其中最有價值的便是S3正在動搖Hadoop的HDFS,K8S正在動搖Hadoop的YARN。HDFS和YARN是Hadoop的根基,根基受到挑戰(zhàn),Hadoop將會淪陷。

但我們看一下Hadoop的歷史就會發(fā)現(xiàn)它從來不缺挑戰(zhàn),比如Spark,當時號稱比Hadoop快一百倍,后來仍然成了Hadoop生態(tài)中的一部分,跟Hadoop和諧共生。而且當時Hadoop才出來沒多久,考慮到已經(jīng)在各大公司部署的龐大Hadoop集群,現(xiàn)在看到K8S和S3就說Hadoop要衰亡,這就有點為時過早了。

Cloudera怎么了?

如果說Hadoop沒問題,那Cloudera暴跌是怎么回事呢?

我們先看這次暴跌發(fā)生的時間點。

這次暴跌發(fā)生在Cloudera 現(xiàn)任 CEO Reilly宣布辭職,并公布了FY20 的第一季度財報之后。

Cloudera在財報里表示其營收略低于預期(預期$188M,完成$187M),并且也調(diào)低了FY20營收預期,從$835M - $855M降到了$745M - $765M,對應的年增長降到了0%-10%。

有人說這種增長率顯然對一個新技術公司來說太低了,是這次暴跌的主要原因。

但我認為這并不充分。

Cloudera在今年1月的時候剛剛完成了與Hortonworks的合并,這種合并必然需要一段時間的調(diào)整期,所以財務情況跟預期略有出入也不是特別意外。

那是不是說這次暴跌是黑天鵝事件,Cloudera本身是沒問題的嗎?

當然不是,Cloudera有問題,而且很大。

它既有遠慮,也有近憂。

先說近憂。

前面提到Cloudera和Hortonworks在今年1月份進行了合并(合并后還叫Cloudera),而兩者都是Hadoop商業(yè)服務公司,各自在Hadoop基礎上都有了自己的產(chǎn)品線,Cloudera的產(chǎn)品叫CDH,Hortonworks的產(chǎn)品叫HDP。

所以合并之后第一個問題便是新公司的產(chǎn)品策略是什么。

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

圖5 Cloudera產(chǎn)品策略

Cloudera CPO Arun Murthy 是這樣說的:Cloudera會在2022年前繼續(xù)支持CDH和HDP兩條產(chǎn)品線,同時也正在開發(fā)新的整合產(chǎn)品——CDP(Cloudera Data Platform)。CDP分兩個版本,第一版基于CDH6和HDP3,目標是兼容兩者現(xiàn)有作業(yè),并做初步整合,算是一個beta版,之后的第二版才是真正的統(tǒng)一版,它將在第一版的基礎上把CDH和HDP兩條產(chǎn)品線里最好的部分挑選出來并進行整合,給客戶更超值的體驗。

Cloudera雖然沒有明確給出CDP的時間點,但Arun簡潔的線框圖似乎在極力暗示著時間是一年一版。

但事實遠不像畫線框圖這么簡單,CDP除了時間之外,還存在著產(chǎn)品形態(tài)的不確定性。

因為CDH和HDP里存在著互斥的部分,只能二選一,比如管理部分,CDH用的自己開發(fā)的管理工具,HDP用的是開源的Ambari;再比如安全部分,CDH用的是Ranger而HDP用的是Sentry。所以到底選哪個,怎么選,選完后原來的客戶要怎么辦,這些都不確定。

不僅如此,CDH和CDP現(xiàn)在又在分別整合對方,比如CDH整合了HDP里的實時處理部分HDF,HDP也整合了CDH的數(shù)據(jù)科學組件CDSW,這更讓人看不懂。

所以Cloudera似乎是迷失在了短期需求與遠期規(guī)劃的三條線路中,還沒找到一個真正的收斂方案。

那就更不要說它的客戶了。

對于現(xiàn)有客戶來說,他們不知道是該在原版本上繼續(xù)升級還是等待整合后的統(tǒng)一版本:原版本升級雖然簡單,但已經(jīng)明確知道這會在兩三年時間內(nèi)被廢棄,到時候還得做遷移,等整合版本吧,又不知道什么時候才能使用。總之是不管哪個決策都不夠理想,所以只能再等等看看,這點在第一季度的財報電話會議上也得到了現(xiàn)任CEO Reilly的承認,他表示Cloudera現(xiàn)有客戶似乎都因為這個的問題推遲了續(xù)費。

而對新用戶來講,更是不知道該選CDH還是HDP還是再等等選CDP。

打個不恰當?shù)谋确秸f,Cloudera讓自己的客戶陷入了驢子吃草的困境之中,這無異于在給競爭對手創(chuàng)造機會。

這個對手不是同做Hadoop商業(yè)服務的MapR,而是全球公共云廠商。

這便是Cloudera的遠慮。

現(xiàn)在已經(jīng)沒必要討論云計算是不是趨勢的問題了,大企業(yè)都在IT上云,云計算已經(jīng)成了規(guī)律,那么自然而然的,作為IT一部分的大數(shù)據(jù)也就被云廠商順手拿走了。

以AWS為例,根據(jù)分析師Rishi Jaluria的預測,單單AWS上的EMR(托管的Hadoop)和Redshift(類似Hadoop+Hive的數(shù)倉解決方案)在2018年的營收之和就接近$700M,幾乎跟合并后的Cloudera總收入相當。如果再考慮其他大數(shù)據(jù)產(chǎn)品,比如營收高達$1.6B的S3(對標Hadoop的HDFS),那么AWS上大數(shù)據(jù)收入將是Cloudera的數(shù)倍。

更不要說加上Azure、Google Cloud和阿里云的部分了。

公共云廠商正在吃掉一切。

而更可怕的是這根本不是競爭。比如前邊雖然提到了有人說S3正在挑戰(zhàn)Hadoop的HDFS,但這種討論只在云的背景下有意義,因為S3不是軟件而是服務,如果你在本地自建一個大數(shù)據(jù)集群,那無論如何S3都威脅不到Hadoop。可一旦企業(yè)上了云,云廠商便掌握了主動權,他有各種機會引導客戶去使用其自研的產(chǎn)品。

這才是真正讓Cloudera頭疼的事情。

Cloudera的反擊

Cloudera對這一切非常清楚,他也給出了自己的對策,這就是前邊提到的CDP。

CDP,全稱叫Cloudera Data Platform,是一個混合云/多云的大數(shù)據(jù)平臺,既支持在本地或私有云上部署,也支持在多個公共云上部署——雖然時間還沒確定,但根據(jù)Cloudera的描述,CDP將會支持AWS、Azure、Google Cloud、IBM Cloud和Oracle,幾乎覆蓋了美國所有云廠商。

而Cloudera的邏輯是,企業(yè)上云已經(jīng)不可避免,但企業(yè)同時想要選擇權,這便是多云/混合云的機會,而且比起某個云廠商來說,第三方多云平臺會更具中立性,這便是CDP的機會。

從某種程度上來說,Cloudera的邏輯和IBM收購Redhat的Openshift是一致的。

所以CDP是Cloudera現(xiàn)在最關鍵的一步,如果成功的話,它不僅統(tǒng)一了Cloudera和Hortonworks的產(chǎn)品線,還能讓Cloudera在云計算的浪潮之中找到自己的位置,可謂一箭雙雕,既解了遠慮又消了近憂。

至于Cloudera的CDP會不會成功,我想現(xiàn)在誰都沒結(jié)論,但有一點是肯定的,那就是在公共云廠商正在吃掉世界的現(xiàn)在,它的問題值得所有技術公司認真考慮。

這是云廠商之間的戰(zhàn)爭,也是技術公司生存的環(huán)境。(本文首發(fā)鈦媒體)

【鈦媒體作者介紹:郭華,微信kakuka1988】

更多精彩內(nèi)容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App

開源平臺Cloudera暴跌40%,Hadoop不行了嗎?

本文被轉(zhuǎn)載1次

首發(fā)媒體 鈦媒體 | 轉(zhuǎn)發(fā)媒體

隨意打賞

apache hadoophadoop開源11平臺
提交建議
微信掃一掃,分享給好友吧。
日韩人妻高清精品专区| 国产成人精品一区二区三区| 国产亚洲精品线观看动态图| 久久夜色精品国产www| 99久久精品全部| 国产精品理论电影| 久久久久亚洲精品日久生情| 精品一区二区三区在线观看| 精品精品国产自在97香蕉| 久久久久国产精品免费免费不卡| 亚洲精品乱码久久久久久中文字幕| 99在线精品视频观看免费| 国产啪精品视频网站免费尤物 | 中文字幕精品在线视频| 最新 国产 精品 精品 视频| 国产一成人精品福利网站| 四虎精品亚洲一区二区三区| 国产精品久久成人影院| 国产精品三级国语在线看| 国产精品久久久久影院嫩草 | 亚洲精品乱码久久久久久中文字幕| 国产精品jizz观看| 亚洲精品久久无码| 精品人妻大屁股白浆无码| 久久亚洲国产欧洲精品一| 国产精品国产三级国产a| 国产精品一区二区久久沈樵| 亚洲精品宾馆在线精品酒店| 3d动漫精品啪啪一区二区中| 国产AV午夜精品一区二区入口| 久久99精品久久久久久秒播| 国产精品WWW夜色视频| 日韩精品人妻一区二区三区四区 | 国产精品久久久久国产精品| 久热爱精品视频线路一| 精品久久久无码21p发布| 人人妻人人澡人人爽人人精品| 亚洲精品成人无限看| 99久久精品费精品国产一区二区| 国产成人精品日本亚洲专区 | 国产成人精品2021|