您的位置: 首頁 >互聯(lián)網(wǎng) >

Snowflake如何挑戰(zhàn)云原生數(shù)據(jù)庫巨頭

2020-06-08 15:02:26 編輯: 來源:
導(dǎo)讀 云計算中出現(xiàn)了一種新的工作負載。早期的云都是關(guān)于基礎(chǔ)設(shè)施即服務(wù)的——旋轉(zhuǎn)存儲、計算和網(wǎng)絡(luò)資源以支持初創(chuàng)企業(yè)、應(yīng)用程序開發(fā)和測試、軟件即服務(wù),并最終將更多的業(yè)務(wù)工作負載轉(zhuǎn)移到云上。 今天的云工作負載已經(jīng)超越了基礎(chǔ)設(shè)施服務(wù),而且越來越多樣化。我們看到的最值得注意的創(chuàng)新之一是通過將人工智能注入到應(yīng)用程序中來利用數(shù)據(jù),簡化分析并借助云計算來提供近乎實時的商業(yè)洞察。在這一大趨勢的中心是一類新的數(shù)據(jù)存儲和

云計算中出現(xiàn)了一種新的工作負載。早期的云都是關(guān)于基礎(chǔ)設(shè)施即服務(wù)的——旋轉(zhuǎn)存儲、計算和網(wǎng)絡(luò)資源以支持初創(chuàng)企業(yè)、應(yīng)用程序開發(fā)和測試、軟件即服務(wù),并最終將更多的業(yè)務(wù)工作負載轉(zhuǎn)移到云上。

今天的云工作負載已經(jīng)超越了基礎(chǔ)設(shè)施服務(wù),而且越來越多樣化。我們看到的最值得注意的創(chuàng)新之一是通過將人工智能注入到應(yīng)用程序中來利用數(shù)據(jù),簡化分析并借助云計算來提供近乎實時的商業(yè)洞察。在這一大趨勢的中心是一類新的數(shù)據(jù)存儲和分析數(shù)據(jù)庫,有些人稱之為企業(yè)數(shù)據(jù)倉庫或EDW——這個術(shù)語對于今天的商業(yè)運行速度來說可能已經(jīng)過時了。

在這一突破性的分析中,我們深入研究了云數(shù)據(jù)庫市場,并仔細觀察了雪花公司(Snowflake Inc.)是如何與亞馬遜網(wǎng)絡(luò)服務(wù)公司(Amazon Web Services Inc.)的Redshift、谷歌LLC的BigQuery和微軟(Microsoft Corp.)的Azure Synapse等競爭的。我們想要完成三件事:

云計算、數(shù)據(jù)科學(xué)工具和現(xiàn)代數(shù)據(jù)庫技術(shù)帶來了一場EDW市場的革命。EDW在支持公司的報告和治理要求,特別是支持薩班斯-奧克斯利法案的會計要求方面起到了關(guān)鍵作用。然而,從歷史上看,EDW未能實現(xiàn)其360度客戶視角和實時洞察的承諾。傳統(tǒng)的企業(yè)數(shù)據(jù)倉庫過于笨重、復(fù)雜、緩慢,跟不上業(yè)務(wù)的速度。

EDW是一個200億美元的市場,但我們認為分析數(shù)據(jù)庫的機會更大。為什么?因為云計算開啟了快速組合多個數(shù)據(jù)源的能力,將數(shù)據(jù)科學(xué)工具引入其中,快速分析數(shù)據(jù)并向業(yè)務(wù)提供接近實時的洞察力——或者,重要的是,允許業(yè)務(wù)線專業(yè)人員以自助服務(wù)模式訪問數(shù)據(jù)。這是一種新的范式,將DevOps的概念應(yīng)用到數(shù)據(jù)管道中——想想敏捷數(shù)據(jù)或“DataOps”。

本地云分析數(shù)據(jù)庫的市場競爭非常激烈。在上個十年的早期,我們看到谷歌將BigQuery帶入市場。但谷歌主要專注于自己的廣告業(yè)務(wù),并花了數(shù)年時間將企業(yè)云作為優(yōu)先事項。

雪花公司成立于2012年,是市場的顛覆者。就在這個時候,AWS達成了一項協(xié)議,獲得了ParAccel MPP數(shù)據(jù)庫的知識產(chǎn)權(quán),亞馬遜紅移就是在這個數(shù)據(jù)庫上建立起來的。在這十年的后期,微軟推出了SQL DW,并在幾周前的Build會議上發(fā)展成為Azure Synapse。還有其他公司,如IBM公司。

這里有很多利害關(guān)系。云提供商想要你的數(shù)據(jù),因為他們明白這是未來十年創(chuàng)新的關(guān)鍵要素之一。摩爾定律不再是經(jīng)濟增長的主要動力。相反,今天是數(shù)據(jù)和人工智能推動了云計算的洞察力。

市場上出現(xiàn)了一個有趣的動態(tài):雪花公司是這個領(lǐng)域的云專家,已經(jīng)獲得了超過10億美元的風(fēng)險投資。它還面臨著大型云計算公司的挑戰(zhàn),這些公司行動迅速,經(jīng)常從雪花公司采取行動,把客戶帶到他們各自的平臺上。但雪花也是云供應(yīng)商的主要合作伙伴,因為它幫助銷售基礎(chǔ)設(shè)施服務(wù)。

例如,雪花最大的云合作伙伴是AWS。雪花推動了亞馬遜EC2的大量銷售。但AWS有紅移,它直接與雪花競爭。紅移經(jīng)常宣布雪花已經(jīng)普及的功能。

這里有一個例子,我們在去年的AWS re:發(fā)明會議上報道過。來自ZDNet的Tony Baer在下面的文章中討論了AWS RA3是如何將計算與存儲分離的。當然,這是雪花的創(chuàng)始建筑原則。

這是另一個來自信息報道的例子,微軟,雪花云的另一個合作伙伴,正在對雪花公司施加壓力。你可以看到下面高亮顯示的文本,作者談到了微軟試圖將客戶轉(zhuǎn)移到它的數(shù)據(jù)庫。

所以就有了這個奇怪的動態(tài)。雪花不在本地數(shù)據(jù)中心運行。它只在云中運行。它運行在AWS、Azure和GCP上。云計算的玩家都想要你的數(shù)據(jù)進入他們的數(shù)據(jù)庫,他們極力要求客戶使用專屬服務(wù)。與此同時,他們需要像Snowflake這樣的獨立軟件供應(yīng)商在他們的云中運行,因為它銷售基礎(chǔ)設(shè)施服務(wù),擴展客戶選擇,發(fā)展生態(tài)系統(tǒng)。

雪花公司是否應(yīng)該轉(zhuǎn)向本地運營,以區(qū)別于云計算巨頭?今年早些時候,我們詢問了雪花公

這是Slootman明確的聲明。我們接下來要提出的問題是:考慮到我們在媒體文章中看到的傳統(tǒng)觀點,云計算玩家將會在這個市場上傷害雪花公司,雪花公司能否競爭?如果是這樣,雪花將如何競爭?

下面的圖表顯示了我們從ETR數(shù)據(jù)集中最喜歡的兩個指標。凈得分,在y軸上——這是支出勢頭的衡量——和市場份額,在x軸上。市場份額是衡量數(shù)據(jù)集中的普遍性的指標,而不是傳統(tǒng)的份額。它是一個公司被提及次數(shù)除以該行業(yè)被提及次數(shù)總數(shù)的計算。下面我們將展示EDW和云本地分析數(shù)據(jù)庫市場的一些主要參與者。

以下幾點值得注意:

底線是雙重的:1)云本地分析數(shù)據(jù)庫市場正在奪取錢包的份額;2)像過去幾次調(diào)查一樣,雪花牌繼續(xù)以最高的消費速度在所有玩家中領(lǐng)先。

讓我們來看看雪花在“Big 3”云中的表現(xiàn)吧。我們從AWS開始。

下面的圖表顯示了客戶在AWS賬戶中的消費勢頭。我們削減了總樣本,只隔離了運行AWS的ETR調(diào)查應(yīng)答者——N為672。條形圖顯示了Snowflake和Amazon紅移的凈分數(shù)粒度。

我們發(fā)現(xiàn),在672個AWS賬戶的N中,有96個共享N響應(yīng)雪花,213個共享N響應(yīng)紅移。顏色顯示的是相對于2019年的2020年消費意向。從左到右閱讀:替換(明亮的紅色),支出減少或增加6%(粉紅色),持平支出(灰色),支出增加超過6%(福雷斯特·格林),平臺增加新內(nèi)容(石灰綠)。

凈得分是用綠色減去紅色。你可以看到,雪花在AWS云上的消費勢頭比亞馬遜的紅移要大一些。

添加綠色條顯示,與2019年相比,2020年80%的AWS賬戶計劃在雪花上花費更多。

其中約35%的消費者將雪花作為新產(chǎn)品添加進來。相比2019年,76%的AWS客戶計劃在2020年增加支出,12%的客戶計劃增加新支出。所以這兩家公司都顯示出非常強勁的支出速度,只有最小的紅色。

至關(guān)重要的是,要在6月份的ETR調(diào)查中看到雪花公司能否保住這些新賬戶。

讓我們看看ETR調(diào)查的數(shù)據(jù)來回答這個問題。

所以我們在上面顯示的是相同的數(shù)據(jù)視圖,除了我們在調(diào)查中隔離了677個Azure帳戶。我們展示了Snowflake和Microsoft對分析數(shù)據(jù)庫分別具有83和393個共享N響應(yīng)的cut -足以得出一些結(jié)論。

注意凈比分。雪花再次以78%對51%的價格勝出。再一次,你可以看到雪花公司有41%的新增業(yè)務(wù),而微軟的凈得分是由現(xiàn)有客戶的增長推動的。兩家公司都很少出現(xiàn)紅色。

讓我們深入研究ETR調(diào)查的數(shù)據(jù)。

下面是上圖中數(shù)據(jù)的相同視圖。不同之處在于,現(xiàn)在我們隔離了298個運行雪花和谷歌分析數(shù)據(jù)庫的GCP帳戶。49的雪花共享的N比其他云要小,因為該公司一年前剛剛宣布支持GCP。但它仍然足夠大,可以從數(shù)據(jù)中得出結(jié)論。你可以看到谷歌共享N在147。

以凈得分或支出勢頭衡量,雪花再次以77.6%的顯著優(yōu)勢勝出,谷歌的得票率為54%。加上這兩條綠色的條,我們再次看到,運營GCP的80%的雪花客戶希望在2020年增加對雪花的消費。谷歌和雪花顯示很少的紅色-一個積極的跡象。

最重要的是,我們的數(shù)據(jù)顯示,在美國三大云服務(wù)提供商中,雪花公司的消費勢頭要比獨占云服務(wù)提供商更強勁的云。

我們已經(jīng)報道了Snowflake是如何從一些傳統(tǒng)的數(shù)據(jù)倉庫廠商,如Teradata和IBM,以及,從我們的數(shù)據(jù)來看,Oracle。我們已經(jīng)報道了IBM的研發(fā)預(yù)算是如何捉襟見肘的。Oracle比IBM更專注于數(shù)據(jù)庫,可以將更多的自由現(xiàn)金用于數(shù)據(jù)庫,但亞馬遜、微軟和谷歌沒有自由現(xiàn)金流問題。

這對雪花來說是一個挑戰(zhàn)。大型云計算公司將繼續(xù)投資并努力跟上雪花的步伐。下面是一個例子。以下是雪花和AWS在這一領(lǐng)域最近的部分創(chuàng)新。這里我們展示了雪花公司在2020年推出的一組功能,AWS在去年推出的一組功能。

其中許多特性將會引起數(shù)據(jù)庫專家的共鳴,比如物化視圖,并且已經(jīng)存在很長時間了。云本地數(shù)據(jù)存儲必須繼續(xù)添加成熟的on-prem棧多年來擁有的關(guān)鍵特性——尤其是治理和安全特性。但關(guān)鍵是,新的領(lǐng)導(dǎo)者正在以云本地的形式添加這些功能。

我們知道AWS在添加特性方面毫不懈怠。亞馬遜在研發(fā)上的投入是雪花公司的兩倍。那么,我們?yōu)槭裁聪矚g雪花的機會呢?

有幾個原因我們認為雪花可以繼續(xù)領(lǐng)先。首先,雪花花在工程、上市和生態(tài)系統(tǒng)上的每一分錢都用于為客戶打造更好的數(shù)據(jù)庫。

在封鎖期間,我們詢問了Frank Slootman在大流行期間如何分配寶貴的資金。他的答復(fù)強調(diào)了這一點:

Slootman在工程領(lǐng)域毫無保留地雇傭員工,因為這是未來的發(fā)展方向數(shù)據(jù)庫分析研究開發(fā)

——Dave Vellante (@dvellante) 2020年6月6日

但這只是故事的一部分。

你們很多人都知道,直到最近我們都對多云持懷疑態(tài)度。我們說過,到目前為止,多云是多廠商和主要廠商營銷的一個癥狀。

這種情況正在開始改變。我們認為,對于組織來說,多云是越來越可行和重要的,特別是當它涉及到數(shù)據(jù)、數(shù)據(jù)位置和全球規(guī)模時。

首先,我們要重申,新的工作負載正在云計算中出現(xiàn)。實時人工智能、洞察提取和人工智能推斷將成為一種具有競爭力的差異化工具。這種新的創(chuàng)新組合源于通過數(shù)據(jù)科學(xué)工具應(yīng)用于數(shù)據(jù)的機器智能,簡化的界面使其能夠與云進行伸縮。

因此,我們認為跨云開發(fā)是Snowflake和其他為多云構(gòu)建高質(zhì)量云本地能力的公司的一個區(qū)別。這對雪花來說意味著什么?為云本地構(gòu)建功能——與將堆棧包裝起來在云中運行相比——是一個關(guān)鍵的區(qū)別。

本地云意味著利用各自云中的原始功能、特性和api來創(chuàng)建盡可能高的性能、最低的延遲和最高效的服務(wù)。它為客戶提供了最安全的體驗。最好的體驗將通過在云中原生構(gòu)建來實現(xiàn),這也是為什么Slootman在這個問題上如此教條。

Multicloud是雪花的一個區(qū)分器。數(shù)據(jù)無處不在,你想把數(shù)據(jù)放在它所處的位置,在AWS, Azure或任何存儲數(shù)據(jù)的云上。如果您的查詢的答案需要通過數(shù)據(jù)網(wǎng)絡(luò)訪問駐留在多個云中的數(shù)據(jù),并且應(yīng)用程序需要快速的答案,那么您必須具有低延遲訪問該數(shù)據(jù)的能力。

雪花的游戲,在我們看來,是自動化數(shù)據(jù)流的一部分通過抽象復(fù)雜位置和延遲相關(guān)數(shù)據(jù),元數(shù)據(jù),帶寬問題,時間查詢,時間回答等,以及優(yōu)化部分的堆棧信息無關(guān)的數(shù)據(jù)的位置。

區(qū)分公式不僅是最好的分析數(shù)據(jù)庫,而且是不可知的。例如,AWS就有一個云議程。Azure和GCP也是如此。他們對多云的最佳回答是把一切都放在他們的云上。

當然,他們會提供跨云服務(wù),但雪花將把它作為首要任務(wù),而且一定是最好的。云提供商只有在探索了“俘虜”選項之后,才會追求多云。這是一種微妙的動態(tài)變化,但我們已經(jīng)在市場上看到了幾十年。

沒有云平臺議程的公司將會有一個強有力的論據(jù),目前我們認為在這個市場上,雪花公司在市場上的地位是最引人注目的。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。