做好智能體應用,最核心的就三個問題:怎么開發、選什么模型、用什么算力。
文|周享玥 趙艷秋
編|石兆
“輕量定制行業智能體,正在成為大模型產業落地的最快路徑。”百度集團執行副總裁、百度智能云事業群總裁沈抖,在6月6日百度智能云與人民日報合辦的2025智能經濟論壇上提到,要真正把AI用到產業深水區,就必須走行業化這一步。
今年被視為智能體落地元年與爆發年,企業紛紛開展應用探索。但業界發現,智能體作為復雜的系統,在市面上秀起來酷炫,一旦被引入企業真實業務場景則效果欠佳甚至翻車。如何避免智能體淪為一場技術狂歡的秀場,目前業界正合力探索行業智能體落地路徑。
論壇上,包括交通銀行、中國中車、國家電網、山東港、廣東交通集團、 山東重工、南方電網等央國企和行業龍頭,圍繞大模型應用和智能體落地等核心問題展開分享探討。百度智能云則從做好智能體應用最核心的三個問題——開發、模型、算力進行了剖析。
01
智能體落地,從通用寬泛走向垂類場景
2025年,被認為是智能體落地的元年,同時也是爆發年。短短幾個月內,業界進行了大量探索。數智前線觀察到,尤其一些大型企業,規劃智能體建設,往往都是按成百上千的數量級在做。
IDC預測,Agent中國市場規模預計將突破300億美元。Gartner數據則顯示,到2028年,至少15%的日常工作決策將通過AI智能體自主做出,1/3的企業級軟件應用當中都會包含智能體
但繁榮背后,企業級智能體的落地仍然面臨不少難題和挑戰。
“嘗鮮期過后,企業客戶不再只為技術買單,而是明確要求智能體必須帶來可衡量的業務成果(ROI),推動定制化需求。”IDC中國高級分析師楊雯告訴數智前線。
企業目前最關注的Top 3問題中,除了任務閉環可靠性,即復雜任務能自主規劃、執行、糾錯直至完成,還包括數據安全與合規性,以及定制化微調的成本與效率,即能否以合理成本、高效地將智能體適配到企業獨特業務和知識上,因為這決定了智能體能否真正落地和發揮價值。
智能體并不能只是一個寬泛的落地,而是要結合具體場景,去實現具體的業務價值。
智能辦公、文檔總結、審批等通用場景,智能體開發難度相對較低,目前已在多個行業中有落地,比如一些企業僅在行政場景就落地了10個智能體,但同時,其帶來的整體價值厚度也相對有限。
與通用場景智能體不同,另一類與業務場景強相關的智能體,如同企業的“業務專家”,價值高潛,但落地門檻極高,不僅需要掌握先進的大模型和技術平臺能力,還需將行業經驗和業務邏輯提煉并轉化為相應的規約模板、提示詞或執行操作步驟,預設到智能體中。
這也是目前企業方和各頭部服務商正在加速攻克和布局的方向。在這個過程中,“‘零號客戶’是現在大家非常關注的。”Gartner研究副總裁孫志勇說,行業經驗,將成為智能體落地競爭中的勝負手。
在本次論壇上,百度與行業龍頭共同推出了“百度智能云精選?業場景智能體家族”。沈抖介紹,在此基礎上,企業只需進行一些輕量定制,就可以快速將這些能力應用到自己的業務系統中
這些行業場景智能體家族,深入到了行業和具體的場景中。
比如面向能源行業的營銷供電方案智能體,由百度智能云和國家電網聯合打造,主要針對電力公司日常工作中最為常見的,因用戶的海量用電需求而需編制成千上萬份供電方案的場景。
過去,光是業務受理環節就要填報大量數據和資質證照,制定方案時要多個部門現場勘查,耗時長、效率低,成本高。現在,在前期業務受理環節,智能體通過多輪對話就可以精準識別用戶辦電需求,利用大模型能力自動生成多套供電方案,還能針對不同偏好的用戶動態調整方案優先級,幫用戶對比不同方案的優劣,輔助企業做出最優選擇。目前,這套流程、知識和工具都已被沉淀下來,可以快速復制到更多的電網系統。
生態環境監測智能體,則能對接環境監測總站所有多源環境質量監測數據,面對復雜的氣候條件,不僅能靈活查詢環境質量狀況,生成質量分析報告,還可以給出精準預測。這個智能體,已經在中國環境監測總站落地,在空氣質量問答、污染源答疑等多個場景下回答準確率超過95%。
“未來,我們還會沉淀更多的行業智能體,賦能更多業務場景。”沈抖表示。
02
要做好智能體應用,需解決哪些核心問題?
雖然業界認為,智能體已從概念驗證階段邁向規模化應用初期,開始走出實驗室和單個試點項目,進入核心業務流程,但目前能在企業生產環境應用的智能體并不多。因為這背后,往往是一套復雜的系統。
“要做好智能體應用,最核心的問題有三個:怎么開發、選什么模型、用什么算力。”沈抖說。這意味著,智能體落地涉及全棧能力。
在如何開發問題上,往往涉及到“一大堆工程”:
比如,它得結合企業的私域數據、企業知識庫,讓Agent學習企業多年沉淀的行業經驗,實現業務需求與技術的對齊。再如,很多企業有自己SOP(標準作業流程),不能讓大模型自己發揮,需要根據企業規范編排業務流程、執行任務。如果涉及多個智能體協同,還需解決精度問題。
一位應用商舉例,三個80%精度的智能體簡單相加,精度可能僅為51%,難以滿足準確性需求。此外,智能體還需要調用各種工具,滿足企業級服務所需的安全性、穩定性和可控性。
在整個過程中,又涉及大量的開發,用到不同的開發架構、編排體系,要涉及到MCP(調用接口)的方式。
針對這一塊市場痛點,多家頭部大模型廠商都在通過打造一個便捷、好用的智能體開發平臺,降低企業級智能體開發門檻。
百度智能云在千帆大模型平臺上,提供了Agent 開發、管理所需的全套工具鏈。企業能快速開發自己的Agents,利用MCP服務激活IT和數據資產,也可以直接使用百度提供的成熟Agents,并在千帆上去持續優化這些Agents。目前,千帆平臺累計幫助用戶精調了 3.3 萬個大模型,開發出 100 多萬個企業級應用。
在模型的選擇上,業內人士介紹,智能體可以根據不同場景,選擇合適的通用大模型、行業大模型,以及小模型,并給出最佳的協作方式。
業界正在不斷增強通用大模型的能力,尤其是在推理、多模態方面的能力,以此提升智能體走向更復雜場景和精細化任務時的落地效果。今年4月,百度全新發布的兩款旗艦模型:文心4.5 Turbo和 X1 Turbo,就大幅提升了多模態感知與推理能力。
通用大模型之外,當下行業里另一個熱烈討論的話題是,到底要不要開發行業大模型?
一些企業認為,行業大模型訓練成本、門檻都比較高,未必是一個最有效的手段。尤其目前通用大模型每周都有更新,很多企業會擔心,自己訓練的行業模型會不會打了水漂。
不過,一些深入到企業垂類場景的智能體,確實需要更專業的行業大模型支撐。是否訓練行業大模型邊界在哪里?“像藥物研發,數據由專家標注,通用大模型的能力很難達到。而在工業場景下,如果沒有觸達到工藝機理深度,行業大模型可以先不著急做。”一位行業人士表示。
在本次論壇上,百度智能云宣布以金融行業為試點,正式推出千帆金融行業大模型——千帆慧金。
百度相關人士告訴數智前線,大模型應用到金融場景,常常會遇到兩大挑戰:
一方面,金融行業的知識面廣、時效性強,對大模型的準確性有嚴格要求,需要行業基礎知識的增強。另一方面,金融行業也有諸如財報或研報的表格分析、房貸利率計算等場景,需要進行推理增強。推理是今年金融行業重點的一個方向。5月,工銀科技有限公司副總經理侯志榮透露,從今年開始,工商銀行的企業級大模型的一個重要方向是金融推理大模型,并解決可解釋性問題。
百度云這次推出的千帆慧金主要圍繞這兩方面所打造,包括一個金融知識增強大模型,基于數百億tokens的高質量金融領域和通用混合語料,可顯著提升金融知識問答、財報分析等行業高頻場景的模型效果;另一個是金融推理增強大模型,專門面向金融行業特有的復雜推理和計算場景。
這兩個模型目前都支持最長32K的上下文輸入,以覆蓋金融行業絕大多數場景,并提供兩個版本參數的模型。其中,8B版本小參數模型,響應快、易部署,適用于意圖識別、指標抽取等對時效要求高、任務相對明確的場景;70B大參數版本則更適合處理復雜推理、多輪任務規劃的問題,比如投研輔助、策略分析。
金融機構可以根據場景需求直接調用,也可以把它們作為基座模型,在實際場景進一步精調專屬模型,以更低的成本、更靈活的部署方式,實現更好的效果。
會議現場,沈抖演示了千帆慧金在銷售賦能場景的應用效果,對比通用模型,千帆慧金根據銷售走訪記錄,以及自己掌握的金融行業know-how,可以更為準確地識別出下一步需要推動貸款簽約,并進行詳細的工作流程規劃,以及更精確的風險提醒。
“金融大模型只是起點。未來,我們會根據客戶需求,推出更多的垂直行業場景模型。”沈抖表示,目前,千帆上已提供超過100個模型服務,企業可以根據業務需要,自由選擇最合適的模型,快速啟動、靈活組合。
03
企業GPU云,從“堆卡為王”走向高利用率
在怎么開發、選什么模型之外,用什么算力也關乎智能體是否能順利落地。實際上,大模型及智能體落地,也引發了企業算力基礎設施的深層次變化。
在大中企業中,通常都有自己的算力基礎設施。從2023年起,這些企業開始陸續建設以GPU為主的算力能力。“企業有不同的規劃和方法。”百度智能云混合云總經理杜海觀察,這主要由人工智能在企業業務中的發展狀態和定位決定。目前企業的建設大致分為四類:
第一類是基于傳統CPU平臺,進行輕量化升級。這類企業原本的CPU云平臺較為完整,已具備小模型支持能力,當前希望增強GPU算力,用于開展大模型的初步探索。幾年前,能源行業用戶多屬于此類。因此,客戶可基于現有CPU平臺進行升級,部署一套輕量化異構計算平臺。如某能源央國企,通過百度百舸模塊化組件,解決異構資源管理、調度與分配。
第二類企業已明確提出大模型場景需求,尤其是發布了行業大模型的企業,開始進入全棧規劃階段。這類企業涵蓋制造、化工、能源等領域,在傳統CPU云平臺之外,正著手打造包括芯片算力、基礎設施、MaaS平臺與應用層的完整AI能力堆棧。以中鋼研為例,它發布了冶金流程感知大模型,聚焦全棧AI架構,看重全棧交付和運維一站式技術兜底能力。
第三類屬于“AI原生企業”,即AI能力本身就是其核心競爭力。典型如車企,正在大規模建設一個或多個GPU集群,水準僅次于互聯網巨頭。其需求不僅是“建起來”,非常看重資源調度、利用率、訓練集群穩定性、模型加速等AI工程化能力。長安汽車即是代表,其超大規模算力中心服務于智能座艙與自動駕駛研發,極度重視跨云統管和調度,以及GPU算力效率提升實戰能力。
第四類企業則在企業自建算力平臺之外,通過GPU算力訂閱服務來滿足短期或峰值需求,降低算力成本。濰柴動力便是此類企業的代表。在推進企業大模型建設過程中,依托百度混合云ABC Stack,結合百舸,實現多場景支撐與資源彈性調度,支撐和擴展其研發、運營、辦公等六大AI場景。
今年企業級客戶在算力效率與穩定性的關注顯著上升。“年初DeepSeek給業界帶來的發展思路,讓大家對于整個集群的使用效率,在最近幾個月達到一個新的頂峰。”杜海告訴數智前線,“前兩年大家在堆卡,這半年我們接觸最多的需求,也是最能打動客戶的,是百舸如何實現將集群效率、穩定性達到更優的狀態。
然而,在具體實踐中,GPU云在硬件結構、任務模式、資源觀測方式等方面與傳統CPU云存在明顯差異,業界在合理使用上,仍處于“磨合期”。為應對這一趨勢,百度智能云和企業一起結合業務,在資源調度、任務編排、性能優化等多環節提開展大量細致的工作,提升整體GPU平均利用率和穩定性。
除了上述特點外,杜海告訴數智前線,大中型企業客戶在算力基礎設施上呈現的另一個重大變革是從私有化部署,走向“混合云”模式。一些客戶要求云廠商將資源部署到自己指定的機房,來滿足其對數據隔離性、網絡安全的嚴格要求;另一些客戶則傾向于公有云上的隔離域,來保障數據安全。
汽車和金融是這一算力策略變化最大的兩個領域。造車新勢力已普遍接納公有云,而傳統車企在電動車業務上,對混合云也展現高接受度。金融行業的變化也非常大。之前由于合規要求,它們都是純私有化部署。而這兩年互聯網銀行與新型金融科技企業,嘗試將部分計算任務遷移至混合云,以應對不斷增長的GPU需求。這種轉變也受到相關新政策支持。此外,能源行業客戶也在向混合云靠攏。
與此同時,國產GPU的接受度快速提升。DeepSeek出來之后,隨著行業標準趨同、實際表現不斷驗證,國產卡在更多場景中被廣泛采納,使用門檻也低于客戶此前預期。
今年,百度成功點亮了昆侖芯三代萬卡及三萬卡集群。目前,國家電網、中國鋼研、招商銀行,以及北大、同濟等高校和互聯網企業,已經開始規模部署P800。在金融領域,百度智能云與招商銀行也正基于昆侖芯P800開展算力合作,穩定支撐該行DeepSeek等各類大模型的訓練與推理任務,部分多模態模型推理性能達到行業領先水平。
“有人說,想象未來最好的方式就是去創造它。”沈抖說,模型能力和工程能力的持續進化、算力成本的不斷降低,會為企業打開想象空間,讓很多原本難以實現的場景,從“不可能”變成“可能”。
伴隨央國企積極布局產業大模型、加速智改數轉,百度智能云已將全棧AI能力體系深度嵌入企業各類業務場景,聯合眾多央國企伙伴打造了一大批可推廣、可復制的標桿案例。數智前線獲悉,目前,已有65%的央企選擇與百度智能云開展深度合作,共同探索AI創新,而受AI驅動,百度智能云業務在2025年第一季度增長強勁,同比增速達42%。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.