作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com
01
火山引擎的名字里沒有云。
這件事在以前是個需要解釋的事情。2020年底,字節內部的關鍵決策會議上,正式決定讓火山引擎對外提供服務、進入真實的市場,而在這個最初的會議上,字節希望這個技術平臺不只是“又一個云計算廠商”。于是干脆從名字就不帶云。
在火山引擎進入這個市場的時刻,云計算正處于焦灼的互卷階段。這是一個需求旺盛的市場,也是一個充滿誘惑的商業戰場,用高舉高打的方式收割一個增長中的市場,它符合外界對彈藥充足的互聯網巨頭們決策思路的想象。而這樣的思路之下,一個產品的名字怎么能不帶“云”呢。
在這些最初的內部會議上,字節對火山引擎的思考呈現出這家公司有些容易被人忽視的一面。據參加會議的人員回憶,最初的各種內部會議上,花最多時間討論的除了認定云市場必須用新方法來找差異化,不去搶那些低垂的果實之外,大家更多在討論兩件事。
一件是,“20年后回頭看今天,云計算是什么樣?”
答案是省、穩定和安全這些基本要求依然必不可少,但同時肯定不能依然只是做CDN等資源的“售賣”,技術棧需要變化。
而更重要的另一件事,是這個從內部正式開啟對外服務的基礎技術平臺,對于字節這家已不再是“后來者”的公司自己來說,到底意味著什么?
討論最終的答案是,它要寄托字節自己真正變成一家科技公司的期待:當時的字節在推薦算法等技術上已經是領先者,但它的基礎設施是建立在外界服務之上的,想成為一家“科技公司”,字節不可能不對云和底層技術也充滿野心,因此它一方面要建設自己的底座,另一方面必須讓它得到最充分的考驗——到最復雜的真實市場里去。
這是很字節的一套做事風格——這家公司是諸多科技公司中,最喜歡以終為始設計業務的公司之一,只不過很多時候它被大家津津樂道的是那些方法論,忽略了它對終局的執念,多名在字節關鍵決策節點參與最核心討論的人士都講述過相似的故事,今日頭條和抖音是從“算法如何改造信息分發”的靈魂拷問出發而誕生,而火山引擎的故事同樣由此開始。
對火山引擎的兩個靈魂拷問相結合,答案就指向了AI。
02
2025年6月11日,火山引擎參與人數破紀錄的最新一次原動力大會上,展示了一組數據:
截至今年5月底,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發布時增長137倍。
Token使用量這個指標可能不如營收數據更能直接體現商業化情況,但在今天AI用量快速爬升階段,它是各家都緊盯著的風向標。前不久Google公布其系統每月處理的token數量激增,從去年的9.7萬億增加到現在的480萬億,這里面包括Google系的各種C端調用。
“據IDC報告,豆包大模型在中國公有云大模型市場份額排名第一,占比達46.4%。”火山引擎總裁譚待在會上引用數據稱。
于是,當AI快速成為計算需求的最主要來源,火山引擎的名字里沒有云這事終于也成了不太需要解釋的事情——計算的需求結構都要徹底變了,能支撐它的必須是全新的圍繞AI的基礎設施,那么今后能吞下這一切的,自然不是過去那朵“云”了。
而且,這一切只是開始。Token瘋漲以及依然會漲下去的根源來自于市場對AI的需求模式的變化。
“我們看到模型的訓練正在從預訓練向后訓練轉移,對大部分企業來說后訓練是一個很重要的事情,而以強化學習為代表的后訓練實際上對基礎設施提出了更高的要求。”譚待提到。
火山引擎完整經歷了這輪AI算力需求的輪轉。從第一天對外開始,字節在它身上的“私心”就是讓全市場來測驗它用來支撐自己最核心技術的底層能力,而字節的技術核心一直是AI和算法——火山引擎從誕生就是死磕AI的一個新型基礎設施平臺。
ChatGPT的震撼一度讓行業有種“斷代”的意味,似乎在它出現后,此前的一切都不做數了。但事實上,今天AI和算法的進步不是抹掉一切重新開始的,它背后有一整個歷史。此前在推薦算法上的理解和積累,依然會對今天有幫助,它讓火山引擎在關鍵節點上更加敏銳。
這從火山引擎的變化中也可以直接感受到,在2020年底正式對外開放后,它一度更多在給外界提供字節自己驗證過的、圍繞模型背后的產品,從A/B測試到數據平臺,這些更多是一些零散的單點產品。
2021年,火山引擎開始提供更接近通常理解的云的服務,直到2023年6月火山方舟出現,圍繞模型構建的系統成型,開始對外提供圍繞AI的系統化的服務,之后這樣的思路不斷加強。
也就是,AI是火山引擎正式變成一個底層設施的根本原因,也是它一切技術產品設計和改進的出發點,這使得2023年當時,火山引擎甚至在字節自己的豆包模型亮相之前率先跑了出來。火山方舟發布時,集成了國內外多家大模型,面向企業提供精調、評測、推理等全方位的平臺服務。而同樣的思路在DeepSeek R1出現后,呈現的更加明顯,火山引擎迅速成為最先接入和服務最穩定的平臺,最終也變成企業級DeepSeek調用最多的平臺。
DeepSeek證明了圍繞模型做基礎設施的極致改進,可以突破現有的云的限制,進而發展成為一個在商業上也可持續的新的基礎服務。這正是火山引擎自己在追逐的,于是動作也就迅速。
另一個最直接的體現,就是外界熱衷討論的“價格戰”。
2024年5月,火山引擎公布了自己在模型調用上更低的定價,這一度被理解為一種云計算競爭的常見手段的再次上演。但在整個行業一系列的跟進動作后,人們很快意識到,在新的token規模經濟之下,當你圍繞模型和AI做工程化的極致改進,隨著模型繼續進步和軟硬件的一系列優化后,這種價格下降是必然結果。
而在6月11日的原動力大會上,譚待干脆帶著現場的人們做起了口算題。“在絕大部分企業請求輸入落在的32K范圍以內,經計算豆包1.6成本只需要不到原來的三分之一,就能獲得一個能力更強,原生多模態的新模型。”
“我們的營收里,與大模型相關的業務貢獻最多,毛利也是最好的。”譚待表示。
當初用來打入這個市場的能力,變成市場結構突變后決定未來競爭格局的最關鍵能力。而火山引擎的差異化也隨著需求的改變,呈現得更加清晰。
03
云計算永遠是個規模的生意。
這個判斷在之前被用來解釋新入場的玩家面對的挑戰之大。但事實上,這句話放在今天更重要的意義在于,“規模”的核心是會改變的,這也正是今天正在發生的最重要的事。
AI注定會吞掉云的一切需求,成為當仁不讓的主角。
在火山引擎的判斷里,這個變化在三個維度展開:一個是推理能力進入視覺和多模態模型里,帶來應用爆發;二是視頻生成大規模進入真實生產環境;第三就是AI Agent走向徹底的普及。
而這些變化也對支撐這些需求的技術帶來新的要求,本質上是云計算從圍繞資源利用和彈性普及,變成了要圍繞算法模型和AI本身來進行計算提效優化的技術。
其中最重要的就是AI Agent眼看要到來的井噴。
“2025年是AI agent的元年。”譚待說。他認為,AI agent背后核心突破在于將大模型的語言理解能力與環境交互、工具調用深度融合,形成目標導向的自主執行系統。
軟件第一次從被動的工具,變成主動的執行者。AI從交付一個中間過程半成品,到交付結果。
根據火山引擎的判斷,隨著大量Agent加速進入現實世界,強化學習帶來的整體算力消耗和IT 支出有可能在2027年附近逼近整個行業在預訓練上的投入。
“如果我們把時間拉長,把技術棧展開。我們實際正處于PC到移動到AI 三個時代的變化之中。在這三個時代里,技術主體在發生變化,PC時代的主體是web,移動時代是APP,AI時代是Agent。”他說。
它需要一次更徹底的重構。在火山引擎的最新更新里,它不再想被過去人為劃分出來的各種分層來束縛,轉而根據需求來源的判斷,設計了對應的核心三件套。
“我們把這些基礎能力原子化,作為三個方案提供給大家,分別是AgentKit,TrainingKit和ServingKit。”譚待說。
在火山引擎內部,他們把AI agent定義成多步驟復雜任務,他們相信這會帶來一個全新的產業。
AgentKit就是對圍繞Agent打造的工具和平臺進行的一個整體的SDK封裝,集成了最新的大模型,開箱即用,強調高可擴展能力。同時,它已經集成了業界數十類三方MCP Server。
另外的Training Kit和Serving Kit也對AI agent的需求提供支持。Training Kit實現高達 60%以上的MFU(算力利用率),在萬卡集群、千億參數的規模上對比開源的方案提升了30%。ServingKit解決的則是模型在推理過程中的效率問題,它強調其通過支持對各種開源框架的優化、對主流模型的算子優化,在性能上比社區的最新版本提升了2-3倍。
觀察這些產品,其中一個最突出特點是,你平常在關于模型訓練和推理上聽到的技術,都直接變成了這個云平臺可以提供的服務。比如后訓練的強化學習、MCP、數據蒸餾,都產品化了。與傳統云廠商的產品技術棧劃分還需要“翻譯”相比,它們如今都直白的放在用戶面前。
“過去幾年傳統云計算在產品層面的創新,其實停滯許久了。”譚待對硅星人說。“今天AI讓云上的產品可以像最早期那樣,有更多創新和產品出來。”
火山引擎把這些產品和技術的重構稱為AI云原生。在大模型帶來各種fancy的新名詞里,這顯得沒那么吸引眼球。但它足夠直接——AI的原生需求變成云最重要的部分,然后云這件事就此改變。
04
火山引擎的進展速度,有時候讓人們幾乎忘了它是個誕生剛五年的業務。
6月11日的原動力大會上,你能從每個角落感到它在這場競爭里的轉折點已經到來。同時在字節跳動的體系內部,它也正在成為新的焦點。梁汝波在大會上以視頻形式亮相,這也是這位CEO第一次出現在火山引擎的發布會。
“做好火山引擎,對字節跳動成為一家優秀的科技公司,保持技術競爭力很重要。”他在開場時說道。
字節要成為一家真正的科技公司,但所謂的科技公司也有很多種,它要成為哪一種?
“優秀的科技公司是能夠運用先進技術的公司,而優秀的創新科技公司是能夠探索和發明新科技的公司。”
而字節一直以來的技術創新,其實有一個不變的線,就是對一個系統的整體探索。今日頭條是“內容生產+分發+反饋”系統,抖音是“興趣識別+推薦反饋+內容供給”系統,飛書是“組織協作+工作流程+數據驅動”的企業操作系統。
火山引擎也延續了這種路線,“AI云原生”這條路也并非孤立的技術選型,更多是字節存在在肌肉記憶里的創新方式在AI時代的投射。但它比以前更進一步,從對技術的運用,到需要對整個系統重新發明——這個系統不再只是AI跑在上面的“云平臺”,而需要就變成AI本身。
“就好像原來的后訓練是一個星球,一個地球,一個火星。但是未來大家看到的后訓練將是一個太陽系。”火山引擎智能算法負責人、火山方舟負責人吳迪在一個小范圍交流里提到。
他形容火山引擎在這飛奔的兩年里,最大的經驗之一是把AI放在更長的視野里來看。
“不能只看模型本身,AI 的綜合能力本質上還是計算機科學的一部分。整個系統的服務能力要夠強,你要把它當成一個完整的計算機系統來看,這件事情特別重要,而且也才是我們長期能夠把性價比做到最優的一個根本性保障。”
除此之外,火山引擎也是字節這家公司從一個互聯網行業后起的挑戰者變成一個在技術上對全行業有更廣泛影響力的成熟科技公司的過程的某種濃縮。
對于一家通過C端產品獲得巨大商業化成功而迅速成長的公司,如何在內部建立起來一個新的團隊,甚至新的文化,去“苦哈哈”地拓展to B的業務,是每個有野心變成真正的科技公司的年輕企業都要面對的問題。
互聯網產品的成功好處在于讓火山引擎可以有更多選擇空間,但也會帶來“挑剔”的問題,當一個需要投入大量時間和人力的客戶,換回的收入還不如某個廣告位的售價,這種影響是很微妙的。這背后,如何理順to C和to B之間的關系,至關重要。
而變化發生的關鍵依然是AI。隨著大模型的需求吞噬掉一切,那些中小創業者成為token消耗貢獻者,而更重要的,過往主要在和數據中心打交道的云計算服務,今天開始更加直接,更向C端靠攏。
字節的C端積累比以前更能服務于火山引擎這樣的B端產品的拓展:一個企業老板很可能用豆包APP的視頻通話來分析自己的體檢報告,他自然可以理解用火山引擎建立一個他自己企業的“豆包”,去識別他生產車間上的關鍵要素。
長期以來,字節強大的技術實力被其耀眼的C端產品光芒所掩蓋。而現在它寄托了自己成長為一家創新科技公司的愿望的to B業務,與從頭條與抖音等產品延伸下來的to C模型產品等,第一次因為AI而更緊密的貫穿在了一起。這都讓火山引擎能成為一種對外的統一出口。
“一直以來,字節在技術創新上的投入是非常大的。未來,我們也會秉持此前的理念,通過火山引擎持續把我們的新模型、新技術開放給企業客戶,讓新技術接受市場的檢驗。”在當天的開場里梁汝波說。
這是字節等待許久也努力營造了許久的時刻,火山引擎不只是一個“云”,它有字節更多的想象,也有機會變成這家公司再往前蛻變的一個支點。
火山引擎讓字節跳動終于可以干它一直想干的事了。
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.