“AI時代誕生了很多優秀的初創公司,這些初創公司有一個特點,人都很少,基于AI,一個人就能做很多人的事情,可能這個公司20個人都不到,但是能持續高速發展,他們的日Token消耗很多,這是一個非常有意義的事情”。
Agent井噴,卡在貴上?
今年5月manus大規模開放注冊,采用消耗積分的方式,成功注冊即可獲得1000積分,此后每天有300額外積分。但真正使用起來不少人發現,隨便一個任務就可以消耗掉這幾百積分。按照manus的收費標準,平均100積分大概1美元,而運行一次任務,大約就要消耗幾十元錢。
一個字,貴。
2025年本應是外界普遍認為的Agent爆發之年,但Agent的高昂成本,已經成為行業內的槽點。
5月下旬天工智能體上線時,昆侖萬維CEO方漢就曾對鳳凰網科技表示,其優勢在于全棧自研實現的性價比與可用性。在其看來,“套殼”類產品,依賴于多個大模型的接口,“這些接口的價格,除非你是大客戶,不然是拿不到比較好的價格的。就算你能拿到比較好的價格,對于內部的成本來說,仍然是要有利潤的,這是我覺得定價上套殼類的一個大問題”。
在行業內manus的最大爭議就是“套殼”,媒體曾報道,manus的海外版主要用的是Claude,平均每執行一個任務,manus要向Anthropic支付2美元,那么相應地,這些成本必然將有一部分轉嫁給使用者。
通常來說,模型的定價按tokens收費,輸入輸出tokens的數量直接決定成本,這意味著,上下文的長度直接決定了成本規模,與是否開啟深度思考和多模態功能的關系則不大。關鍵是,個別模型會采用階梯計價方式,如當tokens數量超過128K時,價格會直接翻倍,又因注意力機制需與前文所有tokens進行關聯計算,從而導致成本大幅遞增。
火山引擎總裁譚待也對我們表示,“對于Agent而言,Token消耗量是很大的,以前AI大模型最早的應用就是聊天,可能一個人跟模型聊一個小時就是20多萬的Token,但是如果你讓Agent做一個任務,因為它要處理特別復雜的事情,這一個任務可能就是20萬Token”,這也意味著,成本是Agent落地當前最大的痛點之一。
一個垂類Agent產品負責人也為鳳凰網科技進行了一次估算,每一次的產品運行,相當于要做一萬多次檢索,背后的算力成本已達到幾十元的水準。也就是說,如果是一個日活在百萬級別的產品,光單日的產品運行成本就將達到上千萬元。更別提千萬級別日活乃至1億日活的超級App。
普華永道2025年5月的調查顯示,88%的企業因Agent計劃增加AI預算,但真正跨應用、跨工作流連接的Agent,目前僅占19%。
除了價格問題,方漢告訴鳳凰網科技,其認為Agent當前用不起來的另一核心問題是,能力上限比較低,“大部分基于工作流跟商業大模型 API的Agent是有上限的,在垂類領域里面能干的活可能還不到六七十分”,此外,其還認為Agent的使用體驗也不好,“其實用戶不太能夠精細地表達他要什么,這更不要說寫一個特別好的prompt”。
背后的隱形玩家
就在Agent市場爆火之后,不少人認為字節和百度等大企業很快就會瞄準這一市場,利用自身的產品與資源優勢,迅速彎道超車。在本次火山引擎發布會后的采訪中,譚待在被問及云廠商與應用開發者的關系時,也從側面回應了這一話題。
其認為,對于云廠商而言,首先是把基礎設施做好,“所以我們更注重的是把圍繞著Agent開發的這些平臺和工具做好,這可能是我們最重要的事情,也是我們擅長的一些能做好的。應用這一塊我們會選一些少數的、我們很有能力做好的,比如說AI coding我們會把這件事好好做,其他我們還是愿意跟生態伙伴一起來合作”。
大模型一直是Agent開發的關鍵要素,正如譚待所言,強推理、多模態、低成本才能支撐Agent的大規模應用。同時,火山引擎還在提供強化學習、Prompt優化、MCP Hub、知識庫、運行沙盒等開發平臺,讓更多開發者可以基于模型開發好Agent。
譚待也在現場告訴我們,火山引擎注意到一個很有意思的點——AI時代誕生了很多優秀的初創公司,這些初創公司有一個特點,“人都很少,基于AI,一個人就能做很多人的事情,可能這個公司20個人都不到,但是能持續高速發展,他們的日Token消耗很多,這是一個非常有意義的事情”。
而為了搶奪更多這樣的初創企業,云廠商拿出了不同的策略?;鹕揭嬖谶@一次的大會現場,再度拿出了價格殺手锏。通過改變定價策略,進一步催化Agent市場爆發。
譚待告訴我們,火山引擎本次降價其實基于幾個大邏輯,“第一,同一個尺寸、參數的模型,開不開啟深度思考,做不做圖像理解,實際上對于成本是沒有影響的。主要影響是上下文窗口”,此前行業普遍會基于模型能力采取不同的定價策略,火山引擎打破了這一行規,通過分桶調度,架構的創新,讓32K上下文長度這一絕大多數需求場景下,成本下降了63%。
鳳凰網科技測算發現,豆包1.6的綜合成本可降至2.6元/百萬tokens,且支持多模態和深度思考。相比之下,豆包1.5深度思考模型或DeepSeek R1的綜合成本為7元/百萬tokens。在Agent的模型調用成本上,豆包1.6直接降到了行業常規水平的三分之一。
IDC數據稱,火山引擎在中國公有云大模型服務調用量上市場份額已達 46.4%,接近一半。“火山引擎和字節跳動國內業務有規模效益,同款GPU的配置價格會低于行業平均水平,卷的起價格”,有行業人士表示。
“模型現在帶來業績增長,這一塊產品的收入增速是在所有產品最快的,遠超其他產品,而且毛利也是最好的之一,我覺得這個業務還是非常值得期待的”,譚待對我們表示。
不過現需要注意的是,在AI云市場上,阿里云、百度云同樣來勢洶洶,阿里曾預期在未來三年投入超3800億元,用于建設云和AI硬件基礎設施,總額超過去十年總和。另據鳳凰網科技了解,在更早之前,阿里將各業務投資部門的權限收回了集團,此后又接連出手了AI智能體平臺斑頭雁、AI infra企業硅基流動等AI基建公司。
值得一提的是,在這一次大會開場,字節跳動CEO梁汝波難得“亮相”,他通過視頻發言表示,AI發展還在很早期,只是馬拉松的前500米。在AI大模型帶來的技術變革時代,字節也要對自己提出更高的要求,做一個優秀的科技公司還不夠,得做優秀的創新科技公司。
來源:鳳凰網科技
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.