技術迭代與商業創新共振
撰文/陳鄧新
編輯/李 季
排版/Annalee
火山引擎,又有大動作了。
2025年6月11日,火山引擎Force原動力大會發布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等重磅新模型,以及迭代了一站式AI云原生全棧服務。
對此,字節跳動CEO梁汝波表示:“做好火山引擎對字節跳動成為一家優秀的科技公司、保持技術競爭力很重要。未來,字節跳動會堅定長期投入,追求智能突破,服務產業應用。通過火山引擎,持續把新模型、新技術開放給企業客戶。”
這意味著,火山引擎成為字節跳動AI的關鍵抓手。
眼下,智能體成為AI落地的最短路徑,火山引擎憑借“性能更強、成本更低、配套更全”的打法,進一步助力企業發力智能體。
毋庸置疑,火山引擎對企業更友好。
性能更強,躋身國際第一梯隊
大模型落地,進入智能體時刻。
火山引擎總裁譚待表示:“如果我們把時間拉長,把技術棧展開,我們實際正處于PC到移動到AI三個時代的變化之中。在這三個時代里,技術主體在發生變化,PC時代的主體是Web,移動時代是APP,AI時代是Agent。”
Agent就是智能體,AI應用的最主流形態。
通俗易懂地說,當AI賦能千行百業成為共識,企業擁抱大模型不再是可選項而是必選項,智能體憑借低門檻、易上手的優勢站上“風口”。
需要注意的是,智能體能不能打,與其底座大模型的性能息息相關。
巧的是,豆包大模型雖然下場稍遲,卻上演了一場后發先至的好戲,成為大模型賽道無可爭議的最大“黑馬”。
截至2025年5月底,火山引擎tokens日均調用量已經達到16.4萬億,較2024年5月發布時增長了137倍。
更為重要的是,豆包大模型1.6系列登場,在GPQA Diamond、AIME25、MultiChallenge上等眾多權威測評集上得分均屬于國際第一梯隊,為企業發力智能體提供多樣化選擇。
其中,豆包1.6為All-in-One綜合模型,是國內首個支持256K上下文的思考模型,具備自適應思考的能力,可根據提示詞難度自動決定是否開啟深度思考,兼顧提升效果與tokens消耗大幅減少的需求。
而豆包1.6—thinking為深度思考強化版,在代碼、數學、邏輯推理等基礎能力上進一步提升,支持構建復雜智能體;豆包1.6—flash則為極速版,延遲極低、TOPT 僅需10ms,適用于智能客服、語音助手等實時交互場景。
事實上,豆包的硬實力,在高考數學成績上表現得淋漓盡致。
做2025高考數學真題,豆包大模型拿下144分,位列國內模型首位,且海淀區高考模擬卷文理科成績全部突破700分,理科成績更是比2024年提升了154分,模型進步的速度令人驚喜。
一名互聯網觀察人士告訴鋅刻度:“大模型是一個重資產賽道,考驗企業在資金、生態、技術、人才等方面的底蘊,Scaling Law之下強者恒強。”
成本更低,打破傳統定價慣例
性能更強之外,成本更低是智能體的另外一個重要訴求。
當下,智能體在手機、汽車、教育、金融等領域重塑生產力與生產關系,隨之而來的則是成本高企的挑戰。
譬如,斯坦福2023年設計的虛擬世界西部小鎮,擁有25個可以戀愛交友的智能體,單個智能體的成本高達每小時20美元。
與之對應的是,智能體市場潛力無限。
《中國AI Agent應用市場概覽(2025Q1)》的數據顯示,2024年中國AI智能體市場規模突破50億元大關,未來四年將以超過60%的年復合增長率迅猛增長。
此背景下,企業亟須極具競爭力的低成本方案。
火山引擎精準地抓住痛點,在性能與成本之間尋求最佳平衡點,打破行業傳統的定價慣例,賦能智能體降本增效。
一方面,抹去功能溢價。
調用深度思考或多模態能力,需要額外付費,早已成為行業的慣例,豆包大模型1.6則一視同仁,原生支持深度思考和多模態,企業無需為token額外買單。
另外一方面,分區定價。
以往,為了省心省力,token的輸入定價并不考慮長度,行業采取固定價格,但是模型的成本存在明顯的“遞增效應”,即輸入上下文長度的增加,模型處理token的難度與成本也隨之增加。
簡而言之,存在分攤成本的現象。
“當前,超過80%的企業調用請求集中在32K tokens以內,若能針對這一主流區間優化調度,可顯著降低整體成本。”譚待如是說。
于是乎,豆包大模型1.6精準匹配企業需求分布,將定價區間按照輸入長度分為0—32K、32K—128K和128K—256K,價格隨著輸入長度的增長而增加。
以企業調用量最大的0—32K為例,豆包大模型1.6的輸入價格為0.8元/百萬tokens、輸出價格為8元/百萬tokens,整體成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一,性價比拉滿。
此外,Seedance 1.0 pro模型價格為0.015元/千tokens,每生成一條5秒的1080P視頻只需3.67元,創下行業最低價。
如此一來,火山引擎“好的模型就是要讓每一家企業都用得起”的理念得以延續,憑借“高質低價”的打法進一步占領企業的心智。
《中國公有云大模型服務市場格局分析,2025年一季度》的數據顯示,2024年中國公有云大模型調用總量達到114.2萬億tokens,其中火山引擎占據46.4%的市場份額,位列第一,調用量幾乎等于第二名與第三名之和。
不難看出,通過抹去功能溢價與分區定價,火山引擎走上一條技術迭代與商業創新共振的降本之路,從而推動行業良性競爭。
對此,譚待曾有言:“對于企業級市場來說,商業模式是建立在可持續發展的基礎上,任何商品必須是盈利的,不能靠補貼來降價。如果降價是虧損的,規模越大虧得越多,這就不是合理的商業模式。”
配套更全,企業實現開發平權
更低成本之外,火山引擎配套更全也尤為值得一提。
要孵化成千上萬的智能體,解決各式各樣實際場景問題,智能體的開發范式勢必煥新,調用中心從傳統的程序員轉移到大模型。
這要求,配套的開發工具不斷降低開發難度,實現開發平權。
火山引擎智能算法負責人吳迪表示:“要構建高生產力的Agent,既要用好AI,整合高質量的應用;又要做好AI,關注底層技術本身的優化和創新。”
鑒于此,火山引擎提供了一站式解決方案,幫助企業高效構建智能體。
即升級發布了PromptPilot、MCP Servers、TRAE、扣子開發平臺等產品,以及多款開源項目,打造了覆蓋大模型開發全鏈路的工具矩陣。
譬如,PromptPilot肩負“翻譯”的重任,幫助開發者將模糊的訴求變為具象化的目標,即便開發者不具備專業的大模型知識,也不影響最終的實際效果,只要開發者對行業領域、應用場景有一定知識儲備和判斷力即可。
換而言之,通過需求理解、問題生成、輸出三個環節的優化,可以提升Prompt調試效率300%,大幅節約智能體的開發時間。
再譬如,火山引擎MCP Server與TRAE、方舟體驗中心、扣子等平臺打通,深度集成云服務能力,從而解決了智能體從概念到落地的鏈路斷層問題。
這么一來,開發者可通過MCP 控制火山引擎的云服務組件,便捷地完成計算、網絡、存儲等環境部署,更快地把一個創意變成一個成熟的產品。
在此基礎之上,火山引擎提供了AI云原生全棧服務,打通了開發、數據、安全等環節,幫助企業快捷落地智能體。
AgentKit、TrainingKit和ServingKit,助力企業做好智能體服務、模型訓練和模型推理;多模態數據湖、Data Agent,助力企業構建智能化、高效化、低成本的智能體數據體系;AICC 密態計算、大模型應用防火墻,助力企業構筑網絡安全防線,抵御針對智能體的惡意攻擊……
以上可見,火山引擎通過全鏈路開發、高性價比基礎設施、安全可靠服務等優勢,成為企業發力智能體的不二選擇。
總而言之,“性能更強、成本更低、配套更全”之下,火山引擎降低了企業入局智能體的門檻,接下來將推動智能體大規模落地。
那么,火山引擎在AI云市場的領先地位,更穩了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.