文 藍鯊財經社 魏強
6月11日,FORCE2025原動力大會·春在北京舉行,會上發布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級了Agent開發平臺等AI云原生服務。
會后,火山引擎總裁譚待接受了媒體的群訪,以下為訪談內容,藍鯊財經社根據速記做整理,有刪減:
問這個月,國內外好多企業都發了企業級Agent的產品,火山發的產品和其他企業相比有什么特點?
譚待:從PC到移動到AI,最重要就是主體。AI時代的主體就是Agents。Agent能夠自主規劃、反思、執行任務。圍繞著Agent,首先是開發范式發生了變化,以前各種各樣的架構本質上都是以程序員為核心更好地去理解、設計業務。現在Agents很多集成步驟是通過模型策略展開的,模型跟工具、環境交互,這需要更好的模型和Agent平臺。基礎架構也一樣。數據以前是For BI,現在For AI,多模態數據是很重要的點。安全也一樣。今天,我們發了兩個新的安全產品,怎么解決大模型防火墻,解決模型投毒被攻擊,以及怎么解決端加密,解決安全隱私的問題,計算架構也一樣。
這一系列的東西我們把它叫做AI云原生。這也是火山最早在業界提出來的。我們希望通過從開發范式到基礎設施到數據到安全的完整AI原生去幫助企業做好這個事情。今天模型上我們帶來了更強大、性價比更高的豆包1.6。
做好Agent,最重要的是底層的模型一定是一個多模態深度思考的模型。如果不是,Agent能做出來的事情很有限,很初級。對于Agent而言,它的Token消耗量很大。AI大模型最早的應用就是聊天,一個人跟模型聊一個小時就是20多萬的Token,但如果讓Agent做一個任務,它要處理特別復雜的事情,一個任務可能就是20萬Token。怎么把Token(成本)降低也很重要。我們創新地做了區間定價,能集中地把企業用得最多的區間的成本降低到63%,相當于只需要以前的1/3。
我們的方舟還發了新功能:Prompt Pilot 、Coding Agent、Trip,知識庫,強化學習,多模態數據湖、安全等一系列方案。最后不僅是一個模型好,也需要去在安全、數據、平臺上去系統解決。
我們有一個優勢就是豆包APP用戶非常多,過程中實踐和總結出很多了做好這種復雜Agent的最佳實踐,不斷通過火山引擎對外提供。
Token降價得到行業認可的訣竅是心誠
問:火山為什么想在Token定價上做創新?能得到行業認可的訣竅是什么?
譚待:心誠。你真心想做這件事情。你不是把不好的模型免費,賺一個吆喝。我們心里想的是,要讓更多人運用AI創造價值。怎么做?就三件事:1、把模型做好;2、把成本做低;3、把應用性、落地性各種工具做好。這三個點從2023年就開始說,沒有變過,未來也會一直這樣。
但做好這件事情關鍵在于不斷的技術創新。2B的商業模式跟2C不一樣,不能羊毛出在豬身上。一開始你就要構建一個正毛利的商業模式才能持續。只能不斷通過技術的創新,包括模型結構創新,模型效果優化,工程、定價的配合。日常的工作中,不管是我還是我們團隊,大家都在想這個事情——怎么把成本做好,把能力做好,把性價比提高。每天看到Token在增長,開發者在群里反饋了很多好的問題,我們幫他們解決了,大家都很開心。
問:Tokens(調用成本)降到原來的1/3是不是技術在成本上的極限?
譚待:技術、軟件和硬件在不斷進步,肯定持續能夠優化成本。我們宗旨是每當我們做到了一定程度后,盡最大可能把技術紅利釋放出來,讓業界所有的開發者和企業受惠,它們AI的應用也會發展得更快。去年我們做豆包1.0,在模型結構和工程上做了大量優化,當時把價格降低99%。很多公司跟隨了我們的政策,中國的大模型就起來了。今年做更復雜的Agent,用到深度思考,多模態模型,成本有點高。
我們的三個原則:
第一、同一個尺寸,同一個參數的模型,開不開啟深度思考,做不做圖文、圖像理解,對成本沒影響。以前大家都是按模型能力定價,深度思考貴一些,圖文理解貴一些,non thinking(音)便宜一點,這次我們做了統一。
第二、我們看到上下文窗口,它是一個累加成本的遞增,但大部分企業實際上它的上下文窗口,特別是輸入是有一個分布區間的。如果在調度上能把不同長度的輸入輸出通過PD分離,再通過集中調度(并行計算如果長度不統一的話會互相思索),把這些架構做好,實際上可以把每一個區間的成本定向優化。絕大部分企業用的32K的范圍內可以做大幅優化。這次我們技術上做了創新,定價上也做了一個區間定價。對于企業來說,再去用Token,在常規的規模里去做推理,成本大幅度降低,降到63%,只需要以前1/3的成本就可以拿到更好的模型,而且是All in one。
第三、我們也對那些簡單的non-thinking做了一個特惠區,0.8、2塊這樣的低價它仍然存在。
這次我們考慮了方方面面,希望跟去年一樣,再一次促進Agent AI的普及。
AI云原生哪些技術變得更重要了?
問:豆包1.6比1.5升級點在哪里?
譚待:我覺得1.6比1.5還是有很多提升的地方。從評測的角度來看,在GPQA、AMI、Multichallenge上,functioncall指令遵循很重要,這有很大提升。Coding上也有很大提升。視覺理解,1.5還有很多對應的VIL模型、LL模型和Thinking模型,1.6我們把它全部合在了一起。但我們有一個增強版的1.6Thinking,這樣用起來更便捷,成本更低,在Coding、在邏輯推理上的能力更好,更適合Agent場景使用。我們應該是國內首個在深度思考支持256K窗口的(大模型)。做復雜任務的時候,特別是處理圖像和GUI操作的或者包括Coding,窗口很容易超過128K。
問:現在很多(技術)核心出發點變成AI,跟過去的云計算比,哪些技術變得重要了,哪些變得不重要了?
譚待:很多東西有延續性。CPU重不重要?還是很重要,因為大部分程序還是基于老的開發方式做的,怎么把這一塊規模化成本做低也很重要。數據庫也很重要,Agent其實就是數據庫變成了更擬人、更好的形式跟人交互。過去為Web、APP、云原生做的那些東西已經成熟了,很難有什么創新。未來AI云原生,從模型到Agent開發工具到多模態數據湖到AI安全,不斷有新的東西出來。不僅是我們,可能整個行業,未來都會圍繞AI云原生不斷做創新,大家可以看到很多眼花繚亂的新產品出來。
問:云對于模型的性能提高和成本降低起到了越來越重要的作用?
譚待:我覺得云本來就是很重要的事情,因為它是數字經濟的底座,AI本身又是能夠進一步擴大經濟和數字經濟的增長,所以云在里面發揮作用更大。對于大模型來說,不僅訓練成本高,推理成本更高,推理有波峰波谷,通過云可以更好去適配更多的硬件,把波峰波谷通過混合調度打平,成本降低。
AI云原生商業模式的變化
問:AI云原生跟云原生最本質的區別是什么?
譚待: 差別是主體變了,變成了Agent。比如訂酒店,如果是一個傳統的APP,比如我想去看有沒有浴缸,我得自己去翻圖片;如果大家有小孩帶出去,經常要跟酒店聯系加床,網站上沒有可選的,你只能打電話。做成Agent之后,它可以主動幫你看圖片,看里面有沒有浴缸,能幫你全網去搜大家的評論,能幫你主動跟前臺打電話。這就是傳統軟件做不了的事情。
云原生為什么而設計?移動互聯網興起,用戶觸點、時長大幅度增長,業務彈性要求更高,發布節奏要求更快。云原生為了APP的最佳實踐而設計,它的最佳實踐是彈性擴縮容、容器化、DevOps、微服務等等。企業的管理軟件也是互聯網化、彈性化。
現在的AI云原生就應該為Agent去設計新的技術棧。AI主體要什么,它要更強的模型、更好的Prompt Pilot,強化解決更特定的任務問題,所以我們有VIL模型。Agent要處理的數據不是結構化和非結構化的數據,它要處理的是各種更原始的多模態數據。以后Agent和Agent之間會互通,互聯,這里面Agent和Agent防護、安全都非常重要。當你意識到主體發生變化之后你就知道我要為新的主體設計技術棧。這就是AI云原生。這不是倒裝據主謂的關系,而是需要你以什么東西為本質思考。
問:云原生的商業模式是IaaS賣資源,PaaS、IaaS賣高價值的軟件,AI云原生的商業模式會發生哪些變化?
譚待:AI云原生其實數據和安全有一些也屬于SaaS,屬于PaaS,IaaS。SaaS、PaaS、IaaS更多從技術形態來看,有時候也很混雜,像Model and Agent是AP,它到底是SaaS還是PaaS?因為它的算力消耗也很密集。
這是為什么我們沒有從這個角度去分,而是分成大家更好理解的比如說我的大數據上要做什么事情,在安全上要做什么事情。我在計算上做什么事情。比如說安全我們有兩個產品,AICC密態計算是一個PaaS產品,通過它的PaaS能做好端側的加密,做好知識庫的加密,做好密鑰的管理。它是一個PaaS產品,也可以執行模型的加密計算,大模型防火墻可能是PaaS也可能是SaaS,因為只需要一些配置就可以保護模型的推理不受到攻擊,不被投毒。
從業務視角大家更好理解,到底AI云原生需要在每個層面做什么事情,可以幫解決什么問題。
問:未來商業模式上會有變化嗎?
譚待:未來IaaS、PaaS(的商業模式)沒有變化,但像SaaS層,以前的SaaS還是一個被動的工具,現在有Agent后能主動幫你做很多事情。比如它能直接幫你寫一個程序。給它付費的時候,不是說看它輸出了多少代碼,而是它幫你做成了什么事情。這有一個很大的商業模式的變化。但我覺得現在也不用過多關注,因為都還在早期。
大模型給火山引擎帶來的業績增長最快
問:基于對今年市場和需求的判斷,火山引擎收入增長和客戶拓展上有哪些目標
譚待:我們目標還是很激進的。因為AI的需求很旺盛,困惑很多——即使有好的模型怎么用起來、怎么用得好也是一個問題。這個階段最重要的是把產品做好做扎實,把成本做低,和互聯網、汽車等標桿客戶把方案做好,讓大家看到更好的示范,自然而然業務目標就可以完成。
問:火山引擎營收中由大模型帶來的增長是?今年會重點攻堅哪些行業客戶?
譚待:大模型帶來的業績增長是所有產品中最快的,毛利也是最好的之一。各行各業都在加速擁抱大模型,包括數字原生的互聯網,汽車、消費電子,零售、金融、能源、航司等。一般來說,數字化基礎越好AI轉型越快。AI時代誕生了很多優秀的初創公司,它們有一個特點,人都很少,可能10-20個人,但是功能產生得很快,每天Token消耗很多。火山的優勢就是軟件可以適配各種各樣的芯片,不僅我們這么做,給客戶也提供了靈活的方案。
問:去年火山自建算力中心提速,如何平衡初期投入與長期成本的優勢?
譚待:建數據中心有三種模式:租用、自建、合作。我們以前自建比較少,現在做得多一些,但整體比例在業界也屬于正常水平。成本平衡不是一個很難的事情,因為所有的建設都是算在成本里。火山一直都是保持毛利OK的情況下去做規模化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.