上月,開源列式數(shù)據(jù)庫廠商ClickHouse宣布完成3.5億美元C輪融資,該輪融資后值達到63.5億美元,幾乎翻了三倍,引發(fā)了業(yè)內(nèi)一輪不小震動。
不光在于融資與估值高低,還在于ClickHouse所在的賽道——AI時代的大數(shù)據(jù)分析和存儲,該領(lǐng)域的客戶需求正日益高漲,同時對數(shù)據(jù)庫的要求也在全面升級。
ClickHouse作為一款開源列式數(shù)據(jù)庫,在處理該類數(shù)據(jù)時表現(xiàn)出的顯著優(yōu)勢,不僅力壓同類型的列式數(shù)據(jù)庫,也讓云數(shù)倉獨角獸Snowflake,以及老牌大廠產(chǎn)品Redshift、BigQuery等有了一絲緊張之感。
ClickHouse脫胎于俄羅斯第一大搜索引擎Yandex的開源項目,于2021年正式獨立為商業(yè)化公司。如今,ClickHouse發(fā)展勢頭正盛,通過向客戶收取云托管費用,其業(yè)務在過去一年增長超過300%,服務企業(yè)客戶超過2000家,覆蓋金融科技、交通、消費者和醫(yī)療保健等多個行業(yè)。最近的一些客戶包括AI初創(chuàng)公司Anthropic、特斯拉,以及阿根廷最大電商Mercado Libre等。另據(jù)外媒可參考消息,ClickHouse在第一季度末時的年經(jīng)常性收入已達到7000萬美元,年化營收運行率接近1億美元。
ClickHouse越來越成為一家不可忽視的數(shù)據(jù)庫廠商。不過,對于ClickHouse的發(fā)展勢頭,首先會存在一個疑問:為什么是此時?以及ClickHouse的市場前景如何?
技術(shù)即是成本護城河
相對于行存儲的傳統(tǒng)關(guān)系型數(shù)據(jù)庫,列式數(shù)據(jù)庫意味著數(shù)據(jù)保存在類似電子表格的行、列中,這種列式架構(gòu)可顯著加快分析型任務的速度。在數(shù)據(jù)處理過程中,數(shù)據(jù)庫系統(tǒng)需要同時從多個存儲區(qū)域檢索數(shù)據(jù),而數(shù)據(jù)訪問速度會顯著受到存儲位置的影響——從相鄰區(qū)域讀取數(shù)據(jù)的速度要遠快于從分散區(qū)域讀取。
ClickHouse從設(shè)計之初就充分利用了這一特性來優(yōu)化查詢性能。它將同一列的數(shù)據(jù)盡可能存儲在相鄰的物理區(qū)域,這種存儲布局使得列數(shù)據(jù)能夠被連續(xù)讀取,大幅減少了尋址時間,從而顯著提升掃描效率。這種設(shè)計特別適合分析型查詢場景,因為這類查詢通常需要快速訪問大量列數(shù)據(jù)。
筆者此前與數(shù)據(jù)庫專家交流獲得一個觀點是,數(shù)據(jù)驅(qū)動的分析應用越來越普遍,要求數(shù)據(jù)庫技術(shù)棧實現(xiàn)統(tǒng)一架構(gòu)。在此之前,這些技術(shù)棧彼此獨立,如MySQL+Teradata+Elastic Search等多個系統(tǒng)搭積木的模式,這個架構(gòu)最大的問題在于過于復雜,需要搭建一個集群來完成數(shù)據(jù)分析的能力,搭建與維護成本較高。
具體而言,如開源的MySQL,這類事務型數(shù)據(jù)庫面向OLTP場景設(shè)計,社區(qū)研發(fā)方向側(cè)重于加強其事務處理的能力,一般無法擴展以應對處理大量、復雜查詢所需要的分析型任務。傳統(tǒng)數(shù)倉針雖內(nèi)部批量處理密集型用例進行了優(yōu)化,但并發(fā)性有限且性能較慢。而類似于Elastic Search的傳統(tǒng)搜索引擎技術(shù),對于非結(jié)構(gòu)化數(shù)據(jù)分析而言成本高昂,包括存儲和計算資源的占用增加,以及無法實現(xiàn)快速精準檢索等因素,限制了其實際應用范圍。
ClickHouse提供了一個專門的解決方案來彌補差距——將高性能分析與當今智能數(shù)據(jù)驅(qū)動應用所需的可擴展性和并發(fā)性相結(jié)合。作為高性能列式存儲,ClickHouse能夠以極低的延遲在海量數(shù)據(jù)集上執(zhí)行交互式分析查詢,非常適合于支持AI和機器學習應用,以及實時分析、可觀測性等任務。
蹭上AI東風
除了技術(shù)架構(gòu)的創(chuàng)新,ClickHouse的發(fā)展也離不開市場與客戶需求的變化。由于企業(yè)不再只是構(gòu)建BI或批量報告,而是希望搭建一個實時的智能數(shù)據(jù)平臺,并且同時為人類和AI Agent所調(diào)取。結(jié)合當前AI Agent的設(shè)計思路,由于生成查詢的速度遠超人類,面向其設(shè)計的數(shù)據(jù)平臺/數(shù)據(jù)庫必須具備低延遲響應、支持交互式分析查詢的能力,同時還要有更高的吞吐量,以滿足其高效處理數(shù)據(jù)的要求。
以近期大熱的AI編程為例。盡管多數(shù)AI編程助手推出時間不長,但開發(fā)者留存率依然較高。據(jù)研究公司Indagari數(shù)據(jù)顯示,至少72%訂閱了編程助手Cursor的用戶在六個月后仍繼續(xù)付費;超過20%的用戶訂閱了多個編程助手,且這一比例還在不斷增長。高留存率反映的是AI編程的強粘性,這也意味著企業(yè)應用開發(fā)速度正借AI之勢迎來快速增長。
AI需要能夠快速釋放數(shù)據(jù)價值的數(shù)據(jù)基礎(chǔ)設(shè)施,這件事情已變得緊迫。
近期,ClickHouse分享了Anthropic應用其數(shù)據(jù)庫解決方案的經(jīng)歷。Anthropic團隊技術(shù)人員給了ClickHouse非常高的評價:“ClickHouse在幫助我們開發(fā)和發(fā)布Claude 4方面發(fā)揮了重要作用。”據(jù)其所述,訓練高級模型需要持續(xù)了解性能指標和系統(tǒng)行為,ClickHouse在實時分析數(shù)據(jù)的速度和靈活性非常高。
對于Anthropic而言,有三點核心訴求:一是實時采集海量數(shù)據(jù),對半結(jié)構(gòu)化數(shù)據(jù)進行快速、多維度分析;二是部署安全;三是可擴展性,能與市面上的可觀測性工具實現(xiàn)良好兼容。但ClickHouse的開源版本并不能完全滿足其上述需求,為此Anthropic選擇在內(nèi)部部署了隔離的ClickHouse Cloud云產(chǎn)品。從控制平臺到數(shù)據(jù)平臺,實現(xiàn)內(nèi)部隔離。
Anthropic在探索智能分析Agent(agentic analytics)領(lǐng)域,通過引入ClickHouse的MCP服務器,Anthropic可以將其模型(例如AI編程工具Claude Code)直接連接到ClickHouse。這意味著,Agent可以通過編程方式查詢指標、詢問、檢索答案,而無需編寫傳統(tǒng)的查詢語言。
一些投資人士指出,在AI興起、市場對數(shù)據(jù)庫軟件需求高漲的當下,ClickHouse可能會與Snowflake競爭,比方說ClickHouse的實時分析能力會優(yōu)于Snowflake。雖然有些客戶想要Snowflake提供的“花哨功能”,但ClickHouse速度更快,更便宜,且專注于實時分析。
業(yè)內(nèi)將ClickHouse與Snowflake、Redshift、BigQuery反復拿來對比的一個核心因素,還在于成本。
一些人士認為,ClickHouse能夠以25%-40%的成本提供相同或更優(yōu)的性能,基本可以取代Snowflake和BigQuery。比如Snowflake在計算方面往往相對昂貴,而BigQuery的按需查詢模型在處理大量數(shù)據(jù)掃描時可能會變得昂貴。早在2023年,ClickHouse就曾公開發(fā)表言論稱,Snowflake等云數(shù)倉產(chǎn)品在滿足客戶需求和性價比上存在的挑戰(zhàn)。
如今,ClickHouse同樣將市場目光放到了Agent領(lǐng)域。據(jù)ClickHouse首席執(zhí)行官Aaron Katz的描述,隨著Agent在數(shù)據(jù)驅(qū)動型應用、可觀測、數(shù)據(jù)基礎(chǔ)設(shè)施等領(lǐng)域的蓬勃發(fā)展,像ClickHouse這類面向Agent的數(shù)據(jù)庫需求已經(jīng)達到一個轉(zhuǎn)折點。分析的未來不僅僅是報表,而是能夠解讀數(shù)據(jù)、出發(fā)工作流并支持實時決策Agent。
一些投資人士認為,隨著開發(fā)人員轉(zhuǎn)向Agent,即Agent可以通過客戶瀏覽器或企業(yè)應用執(zhí)行復雜任務,ClickHouse將迎來更高的需求。
這點也成為風投追捧ClickHouse作為下一個Snowflake繼任者的關(guān)鍵點。畢竟,在數(shù)據(jù)庫領(lǐng)域,能夠快速發(fā)展的初創(chuàng)型軟件公司,不多了。
三位創(chuàng)始人:CEO Aaron Katz;CTO Alexey Milovidov;產(chǎn)品 Yury Izrailevsky
回顧ClickHouse的發(fā)展,該公司始于俄羅斯科技巨頭Yandex的內(nèi)部需求。2009年,為了高效處理Yandex.Metrica搜索引擎的海量數(shù)據(jù)分析任務,Yandex團隊開始研發(fā)一款高性能列式數(shù)據(jù)庫,這便是ClickHouse的雛形。經(jīng)過多年內(nèi)部優(yōu)化,2016年Yandex將其開源,憑借卓越的查詢速度和對大規(guī)模數(shù)據(jù)分析的天然優(yōu)勢,ClickHouse迅速在開發(fā)者社區(qū)走紅,成為OLAP領(lǐng)域的明星項目。
隨著開源生態(tài)的壯大,ClickHouse的核心團隊在2021年從Yandex獨立,并獲得了硅谷風投的青睞。公司成立后,團隊在保持開源版本活力的同時,開始推進商業(yè)化,于2022年推出ClickHouse Cloud托管服務,并完成數(shù)輪融資,估值一度飆升至20億美元。
在獲得該輪融資后,ClickHouse步伐明顯加快,除了推動大客戶市場打開,最新任命了在Atlassian、Slack等頭部SaaS軟件企業(yè)的銷售老兵Kevin Egan為首席營收官,還同步收購了HyperDX、PeerDB等初創(chuàng)公司。(本文首發(fā)于鈦媒體APP,作者 | 楊麗,編輯 | 蓋虹達)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.