智源技術(shù)分享：大模型行業(yè)應(yīng)用新模式和關(guān)鍵實現(xiàn)路徑

2025-05-13 14:49:46　來源: InfoQ

北京舉報

分享至

分享嘉賓 | 周華

審校 | 李忠良

策劃 | AICon 全球人工智能開發(fā)與應(yīng)用大會

在不久前舉辦的 AICon 全球人工智能開發(fā)與應(yīng)用大會上智源研究院大模型行業(yè)應(yīng)用總監(jiān)周華為我們帶來了精彩專題演講“智源技術(shù)分享：大模型行業(yè)應(yīng)用新模式和關(guān)鍵實現(xiàn)路徑”，演講分析當(dāng)前行業(yè)企業(yè)在大模型落地過程中技術(shù)團(tuán)隊普遍會遇到的問題和障礙，結(jié)合智源研究院在大模型產(chǎn)業(yè)落地過程中的實踐經(jīng)驗，總結(jié)幫助企業(yè)跨越大模型應(yīng)用技術(shù)障礙的以大模型為核心新型技術(shù)路徑，涵蓋數(shù)據(jù)、模型評測、模型訓(xùn)練和應(yīng)用集成，并針對行業(yè)落地過程中突出的數(shù)據(jù)問題給出數(shù)據(jù)生產(chǎn)流程的構(gòu)建技術(shù)建議，最后向各行業(yè)的大模型應(yīng)用開發(fā)者分享智源研究院在大模型行業(yè)應(yīng)用方向上的最新開源技術(shù)成果。

內(nèi)容亮點：

理解大模型行業(yè)應(yīng)用落地問題的深層次原因；
理解大模型行業(yè)應(yīng)用的獨特技術(shù)差異，獲得以大模型為核心的應(yīng)用構(gòu)建的技術(shù)方法；
高效構(gòu)建可持續(xù)行業(yè)大模型數(shù)據(jù)生產(chǎn)流程的技術(shù)方案；
智源研究院最新的大模型行業(yè)應(yīng)用相關(guān)開源技術(shù)成果詳細(xì)講解。

以下是演講實錄（經(jīng) InfoQ 進(jìn)行不改變原意的編輯整理）。

去年，我們經(jīng)歷了一場被稱為“百模大戰(zhàn)”的激烈競爭，這場競爭主要在通用領(lǐng)域展開。然而，從今年開始，我們注意到眾多企業(yè)，包括央企和國企，以及中小企業(yè)，都開始著手將這些模型應(yīng)用于具體的行業(yè)實踐中。

盡管行業(yè)落地的挑戰(zhàn)顯而易見，但我們可以認(rèn)為，我們的大模型應(yīng)用的發(fā)展已經(jīng)進(jìn)入了一個新的階段，也就是所謂的行業(yè)落地“深水區(qū)”。下面，我將與大家分享一個我在過去兩年中一直在研究的話題，即《大模型在行業(yè)應(yīng)用中的新模式和關(guān)鍵實現(xiàn)路徑》。

1 AI 大模型浪潮推動企業(yè) IT 系統(tǒng)架構(gòu)變革

回顧歷史，早期計算機系統(tǒng)進(jìn)入企業(yè)時，主要是以流程為中心，強調(diào)企業(yè)流程的優(yōu)化和支持復(fù)雜流程的實現(xiàn)。進(jìn)入 21 世紀(jì)，隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的興起，架構(gòu)逐漸轉(zhuǎn)向以服務(wù)為核心。

對于資深從業(yè)者來說，可能還記得 AWS 早期提出的企業(yè)部門間以 API 的服務(wù)形式對外的理念，這一理念經(jīng)過多年實踐已經(jīng)得到了很好的執(zhí)行，特別是在微服務(wù)架構(gòu)的落地上。

到了 2010 年左右，云計算和大數(shù)據(jù)技術(shù)成為主流，企業(yè)開始以數(shù)據(jù)為核心，大量大數(shù)據(jù)平臺應(yīng)運而生，主要處理結(jié)構(gòu)化數(shù)據(jù)，同時也涉及非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)被視為企業(yè)的重要資產(chǎn)。

ChatGPT 的出現(xiàn)標(biāo)志著一個新的轉(zhuǎn)變，我們正在進(jìn)入一個以大模型為核心的時代。但這并不意味著數(shù)據(jù)將不再重要，實際上，數(shù)據(jù)和大模型是相互結(jié)合并行發(fā)展的。

未來，大模型將進(jìn)一步整合數(shù)據(jù)和服務(wù)，利用其強大的泛化能力，支持系統(tǒng)執(zhí)行許多以往需要人工完成的任務(wù)。智能系統(tǒng)不再是單純的工具，而是成為一種能夠主動學(xué)習(xí)、自適應(yīng)和協(xié)調(diào)的智能體，支持企業(yè) IT 系統(tǒng)的發(fā)展。因此，以大模型為核心的系統(tǒng)將成為企業(yè) IT 系統(tǒng)發(fā)展的重要方向。

以 AI 和大模型為核心的應(yīng)用系統(tǒng)正在經(jīng)歷一場演進(jìn)。在沒有大模型的時代，用戶使用 IT 系統(tǒng)的過程是手動的：用戶需要設(shè)定任務(wù)目標(biāo)，規(guī)劃流程，分析信息，執(zhí)行路徑，最終獲得所需結(jié)果。在這個過程中，用戶需要與系統(tǒng)交互，了解系統(tǒng)功能，并選擇相應(yīng)的功能來提出請求，獲得請求結(jié)果，然后決定選擇下一個應(yīng)用功能。開發(fā)人員的主要任務(wù)是從功能上實現(xiàn)整個 IT 系統(tǒng)服務(wù)，這是當(dāng)前傳統(tǒng)的模式。

隨著大模型的引入，我們看到了一種新模式的出現(xiàn)。在許多企業(yè)應(yīng)用中，多智能體助手成為核心，它們背后依托的是行業(yè)大模型。用戶只需設(shè)定任務(wù)目標(biāo)，智能體助手將負(fù)責(zé)執(zhí)行用戶想要的操作，并最終提供任務(wù)完成的結(jié)果。智能體助手將接管任務(wù)分解、規(guī)劃和執(zhí)行的工作。

在 ChatGPT 剛出現(xiàn)時，我們可能直接與模型對接，進(jìn)行問答形式的交互，大模型還無法與 IT 系統(tǒng)進(jìn)行整合。要讓大模型真正融入 IT 系統(tǒng)，必須與現(xiàn)有的 IT 系統(tǒng)對接。智能體通過函數(shù)調(diào)用或工具調(diào)用與 IT 系統(tǒng)對接，這一過程與用戶與系統(tǒng)的交互過程非常相似，實際上是讓多智能體助手幫助用戶發(fā)起請求、獲取和處理請求。

應(yīng)用開發(fā)者不僅要維護(hù)現(xiàn)有的 IT 系統(tǒng)，還需要實現(xiàn)智能體應(yīng)用。同時，算法工程師這一新角色變得非常重要，他們負(fù)責(zé)訓(xùn)練驅(qū)動行業(yè)應(yīng)用智能體的核心大模型，并提供模型服務(wù)。

智能體與傳統(tǒng)系統(tǒng)之間的分工是，智能體完成專業(yè)的認(rèn)知任務(wù)，而非認(rèn)知性的，程序化的任務(wù)則保留在傳統(tǒng)系統(tǒng)中，通過原有接口和工具執(zhí)行。在這種分工趨勢下，許多應(yīng)用系統(tǒng)都將朝著這個方向發(fā)展，智能體和傳統(tǒng)系統(tǒng)將共同協(xié)作，為用戶提供更加智能化的服務(wù)。

2 以 AI 大模型為核心的應(yīng)用系統(tǒng)關(guān)鍵實現(xiàn)路徑

實現(xiàn)以大模型為核心的企業(yè) IT 應(yīng)用系統(tǒng)的關(guān)鍵路徑可以分為以下幾個主要模塊。首先，我們需要進(jìn)行需求分析和方案設(shè)計，這是實現(xiàn)系統(tǒng)的第一步。接下來，在完成方案設(shè)計后，我們將并行進(jìn)行模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用系統(tǒng)的開發(fā)。在整個過程中，數(shù)據(jù)工程被視為核心，因此被放在中間位置。

具體來看，需求分析和方案設(shè)計階段與我們傳統(tǒng)的 IT 系統(tǒng)設(shè)計相似，但存在一些差異。首先，我們需要進(jìn)行可行性分析，這是任何項目啟動前的標(biāo)準(zhǔn)步驟。然后，我們要梳理模型的業(yè)務(wù)需求，這是確保模型能夠滿足實際業(yè)務(wù)需求的關(guān)鍵步驟。

接著是模型能力的定義，這一點與傳統(tǒng) IT 系統(tǒng)不同，需要明確系統(tǒng)的應(yīng)用場景，并梳理出哪些任務(wù)可以由模型執(zhí)行，哪些仍需依賴現(xiàn)有的 IT 系統(tǒng)。最獨特的地方在于評測體系的建立。

在傳統(tǒng)的 IT 系統(tǒng)中，我們通常通過測試用例來進(jìn)行測試，但現(xiàn)在我們需要構(gòu)建一套測試集來評估模型或基于模型的智能體，因為模型或基于模型的智能體的輸出并不是完全確定的。能夠成功完成任務(wù)的評估結(jié)果可能以百分比形式呈現(xiàn)，一般而言都不是絕對的 100%。最后，我們需要確定總體的應(yīng)用方案，這是需求分析和方案設(shè)計階段的總結(jié)。

在實現(xiàn)以大模型為核心的企業(yè) IT 應(yīng)用系統(tǒng)中，模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用開發(fā)是三個關(guān)鍵環(huán)節(jié)。首先，我們來看數(shù)據(jù)工程。企業(yè)擁有大量數(shù)據(jù)，但關(guān)鍵在于如何收集數(shù)據(jù)、判斷哪些數(shù)據(jù)有用。

這需要根據(jù)模型的能力需求來確定數(shù)據(jù)的方向。數(shù)據(jù)分為外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)，外部數(shù)據(jù)主要是行業(yè)通用的專業(yè)知識，需要有獲取渠道；內(nèi)部數(shù)據(jù)則是專業(yè)的業(yè)務(wù)數(shù)據(jù)，需要盤點并進(jìn)行文檔預(yù)處理和數(shù)據(jù)集制作。文本數(shù)據(jù)和多模態(tài)數(shù)據(jù)的處理也包括在內(nèi)。

此外，如果應(yīng)用需要向量數(shù)據(jù)庫，就需要進(jìn)行數(shù)據(jù)拆分。如果向量模型的準(zhǔn)確率和召回率不高，還需要準(zhǔn)備微調(diào)數(shù)據(jù)。對于大型項目，可能還需要制作繼續(xù)訓(xùn)練的數(shù)據(jù)集和微調(diào)的指定數(shù)據(jù)，甚至是人力對齊的數(shù)據(jù)。數(shù)據(jù)工程強調(diào)的是了解數(shù)據(jù)位置、盤點數(shù)據(jù)以及獲取外部專業(yè)數(shù)據(jù)的渠道。

接下來是模型訓(xùn)練，AI 大模型的應(yīng)用系統(tǒng)中模型訓(xùn)練常被首先提及，但實際上它并不是一個非常難的環(huán)節(jié)，因為模型訓(xùn)練的方法在通用領(lǐng)域已有解決方案，我們只需遵循即可。模型訓(xùn)練有兩個分支：RAG 方向和 CPT（繼續(xù)預(yù)訓(xùn)練）或 SFT 方向。

RAG 方向的模型訓(xùn)練是指針對 Embedding 模型在專業(yè)領(lǐng)域性能下降的問題，需要使用企業(yè)專業(yè)數(shù)據(jù)進(jìn)行 Embedding 模型微調(diào)的訓(xùn)練。模型訓(xùn)練的關(guān)鍵在于模型的選型，需要根據(jù)業(yè)務(wù)場景選擇最合適的模型，并考慮模型在系統(tǒng)中的能力要求，選取適合評估相關(guān)能力的評測指標(biāo)，并選擇評測指標(biāo)強的模型。

最后，使用準(zhǔn)備好的數(shù)據(jù)進(jìn)行模型訓(xùn)練，這個過程可能需要多輪迭代，如果評測結(jié)果不佳，可能需要回到數(shù)據(jù)層面解決能力問題。

最后是智能體應(yīng)用的開發(fā)，這與傳統(tǒng)模式有所不同。需要根據(jù)需求明確智能體應(yīng)用的功能，設(shè)計整體架構(gòu)，以及執(zhí)行流程，可能是順序執(zhí)行或?qū)蛹増?zhí)行。同時，需要提出智能體核心模型的需求，并設(shè)計和管理提示詞庫，建議統(tǒng)一管理提示詞并進(jìn)行集中評測和優(yōu)化。記憶體的設(shè)計也非常關(guān)鍵。

在完成這些準(zhǔn)備工作后，將流程串聯(lián)起來，實現(xiàn)智能體與現(xiàn)有 IT 系統(tǒng)的對接，并進(jìn)行測試評估。這不僅僅是軟件測試，更多的是評估智能體是否達(dá)標(biāo)，如果不達(dá)標(biāo)，可能需要進(jìn)行迭代優(yōu)化。

最后要說明的一點是，智能體應(yīng)用的發(fā)展目前剛剛起步，各種框架實現(xiàn)群雄逐鹿，生產(chǎn)環(huán)境可用性需要開發(fā)團(tuán)隊有很大的耐心去試錯填坑，并且智能體應(yīng)用的工程化實現(xiàn)的思路和傳統(tǒng)軟件工程化實現(xiàn)思路差異還是比較大的，這也是未來智能體應(yīng)用開發(fā)者們要解決的問題。

在完成模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用開發(fā)這三個關(guān)鍵任務(wù)之后，我們進(jìn)入最后的部署階段。這包括模型的生產(chǎn)部署、檢索正向庫的構(gòu)建、智能應(yīng)用體的生產(chǎn)系統(tǒng)集成，以及系統(tǒng)的上線。

項目完成后，我們可以進(jìn)行 demo 展示或者實現(xiàn)項目的結(jié)算結(jié)項，這是整個實現(xiàn)路徑的最終步驟。

上述所有這些實現(xiàn)過程與傳統(tǒng)的 IT 系統(tǒng)實現(xiàn)有著相似之處。我們需要定義系統(tǒng)的能力，即需求，從模型的能力出發(fā)去訓(xùn)練模型。

以一個具體的例子來說，如果我們要在醫(yī)療行業(yè)應(yīng)用大模型，我們不僅需要通用的語言能力和安全價值觀，還需要將醫(yī)療業(yè)務(wù)能力整合進(jìn)去。這種業(yè)務(wù)能力是層級性的，需要逐步分解。

從最頂層開始，逐步細(xì)化，直至分解為一個個具體任務(wù)。每個任務(wù)對應(yīng)需要的數(shù)據(jù)類型和評測性能的標(biāo)準(zhǔn)。

總之，我們需要從能力出發(fā)選擇合適的模型，根據(jù)能力需求收集或制作訓(xùn)練數(shù)據(jù)，并指導(dǎo)模型訓(xùn)練。這個過程要求我們不僅要關(guān)注技術(shù)實現(xiàn)，還要深入理解業(yè)務(wù)需求，確保大模型能夠真正融入并提升企業(yè)的 IT 系統(tǒng)能力。

3 總結(jié)

對于企業(yè) IT 系統(tǒng)的未來，它肯定會朝著以大模型為核心的應(yīng)用體系架構(gòu)發(fā)展。大模型的能力決定了我們系統(tǒng)的能力上限，因此我們的評測也主要是針對模型的能力來進(jìn)行。

多智能體系統(tǒng)的開發(fā)和應(yīng)用將拓展大模型的能力，不再局限于簡單的問答，而是與 IT 系統(tǒng)聯(lián)動，極大擴展模型的能力。我們需要以用戶助理的視角來理解新的業(yè)務(wù)和技術(shù)特點，而不僅僅是作為開發(fā)者解決用戶的功能需求。

對于關(guān)鍵路徑而言，需求和業(yè)務(wù)場景是引領(lǐng)整個關(guān)鍵路徑的核心。工程、數(shù)據(jù)工程、模型訓(xùn)練以及多智能體應(yīng)用開發(fā)需要齊頭并進(jìn)，其中業(yè)務(wù)場景和數(shù)據(jù)工程可能在企業(yè)應(yīng)用智能化改造的前期過程中是最為重要的。

AICon 2025 強勢來襲，5 月上海站、6 月北京站，雙城聯(lián)動，全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合，匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票，一同探索 AI 應(yīng)用邊界！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.