99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智源技術(shù)分享:大模型行業(yè)應(yīng)用新模式和關(guān)鍵實現(xiàn)路徑

0
分享至


分享嘉賓 | 周華

審校 | 李忠良

策劃 | AICon 全球人工智能開發(fā)與應(yīng)用大會

在不久前舉辦的 AICon 全球人工智能開發(fā)與應(yīng)用大會上智源研究院大模型行業(yè)應(yīng)用總監(jiān)周華為我們帶來了精彩專題演講“智源技術(shù)分享:大模型行業(yè)應(yīng)用新模式和關(guān)鍵實現(xiàn)路徑”,演講分析當(dāng)前行業(yè)企業(yè)在大模型落地過程中技術(shù)團(tuán)隊普遍會遇到的問題和障礙,結(jié)合智源研究院在大模型產(chǎn)業(yè)落地過程中的實踐經(jīng)驗,總結(jié)幫助企業(yè)跨越大模型應(yīng)用技術(shù)障礙的以大模型為核心新型技術(shù)路徑,涵蓋數(shù)據(jù)、模型評測、模型訓(xùn)練和應(yīng)用集成,并針對行業(yè)落地過程中突出的數(shù)據(jù)問題給出數(shù)據(jù)生產(chǎn)流程的構(gòu)建技術(shù)建議,最后向各行業(yè)的大模型應(yīng)用開發(fā)者分享智源研究院在大模型行業(yè)應(yīng)用方向上的最新開源技術(shù)成果。

內(nèi)容亮點:

  • 理解大模型行業(yè)應(yīng)用落地問題的深層次原因;

  • 理解大模型行業(yè)應(yīng)用的獨特技術(shù)差異,獲得以大模型為核心的應(yīng)用構(gòu)建的技術(shù)方法;

  • 高效構(gòu)建可持續(xù)行業(yè)大模型數(shù)據(jù)生產(chǎn)流程的技術(shù)方案;

  • 智源研究院最新的大模型行業(yè)應(yīng)用相關(guān)開源技術(shù)成果詳細(xì)講解。

以下是演講實錄(經(jīng) InfoQ 進(jìn)行不改變原意的編輯整理)。

去年,我們經(jīng)歷了一場被稱為“百模大戰(zhàn)”的激烈競爭,這場競爭主要在通用領(lǐng)域展開。然而,從今年開始,我們注意到眾多企業(yè),包括央企和國企,以及中小企業(yè),都開始著手將這些模型應(yīng)用于具體的行業(yè)實踐中。

盡管行業(yè)落地的挑戰(zhàn)顯而易見,但我們可以認(rèn)為,我們的大模型應(yīng)用的發(fā)展已經(jīng)進(jìn)入了一個新的階段,也就是所謂的行業(yè)落地“深水區(qū)”。下面,我將與大家分享一個我在過去兩年中一直在研究的話題,即《大模型在行業(yè)應(yīng)用中的新模式和關(guān)鍵實現(xiàn)路徑》。

1 AI 大模型浪潮推動企業(yè) IT 系統(tǒng)架構(gòu)變革

回顧歷史,早期計算機系統(tǒng)進(jìn)入企業(yè)時,主要是以流程為中心,強調(diào)企業(yè)流程的優(yōu)化和支持復(fù)雜流程的實現(xiàn)。進(jìn)入 21 世紀(jì),隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的興起,架構(gòu)逐漸轉(zhuǎn)向以服務(wù)為核心。

對于資深從業(yè)者來說,可能還記得 AWS 早期提出的企業(yè)部門間以 API 的服務(wù)形式對外的理念,這一理念經(jīng)過多年實踐已經(jīng)得到了很好的執(zhí)行,特別是在微服務(wù)架構(gòu)的落地上。

到了 2010 年左右,云計算和大數(shù)據(jù)技術(shù)成為主流,企業(yè)開始以數(shù)據(jù)為核心,大量大數(shù)據(jù)平臺應(yīng)運而生,主要處理結(jié)構(gòu)化數(shù)據(jù),同時也涉及非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)被視為企業(yè)的重要資產(chǎn)。

ChatGPT 的出現(xiàn)標(biāo)志著一個新的轉(zhuǎn)變,我們正在進(jìn)入一個以大模型為核心的時代。但這并不意味著數(shù)據(jù)將不再重要,實際上,數(shù)據(jù)和大模型是相互結(jié)合并行發(fā)展的。

未來,大模型將進(jìn)一步整合數(shù)據(jù)和服務(wù),利用其強大的泛化能力,支持系統(tǒng)執(zhí)行許多以往需要人工完成的任務(wù)。智能系統(tǒng)不再是單純的工具,而是成為一種能夠主動學(xué)習(xí)、自適應(yīng)和協(xié)調(diào)的智能體,支持企業(yè) IT 系統(tǒng)的發(fā)展。因此,以大模型為核心的系統(tǒng)將成為企業(yè) IT 系統(tǒng)發(fā)展的重要方向


以 AI 和大模型為核心的應(yīng)用系統(tǒng)正在經(jīng)歷一場演進(jìn)。在沒有大模型的時代,用戶使用 IT 系統(tǒng)的過程是手動的:用戶需要設(shè)定任務(wù)目標(biāo),規(guī)劃流程,分析信息,執(zhí)行路徑,最終獲得所需結(jié)果。在這個過程中,用戶需要與系統(tǒng)交互,了解系統(tǒng)功能,并選擇相應(yīng)的功能來提出請求,獲得請求結(jié)果,然后決定選擇下一個應(yīng)用功能。開發(fā)人員的主要任務(wù)是從功能上實現(xiàn)整個 IT 系統(tǒng)服務(wù),這是當(dāng)前傳統(tǒng)的模式。

隨著大模型的引入,我們看到了一種新模式的出現(xiàn)。在許多企業(yè)應(yīng)用中,多智能體助手成為核心,它們背后依托的是行業(yè)大模型。用戶只需設(shè)定任務(wù)目標(biāo),智能體助手將負(fù)責(zé)執(zhí)行用戶想要的操作,并最終提供任務(wù)完成的結(jié)果。智能體助手將接管任務(wù)分解、規(guī)劃和執(zhí)行的工作。

在 ChatGPT 剛出現(xiàn)時,我們可能直接與模型對接,進(jìn)行問答形式的交互,大模型還無法與 IT 系統(tǒng)進(jìn)行整合。要讓大模型真正融入 IT 系統(tǒng),必須與現(xiàn)有的 IT 系統(tǒng)對接。智能體通過函數(shù)調(diào)用或工具調(diào)用與 IT 系統(tǒng)對接,這一過程與用戶與系統(tǒng)的交互過程非常相似,實際上是讓多智能體助手幫助用戶發(fā)起請求、獲取和處理請求。

應(yīng)用開發(fā)者不僅要維護(hù)現(xiàn)有的 IT 系統(tǒng),還需要實現(xiàn)智能體應(yīng)用。同時,算法工程師這一新角色變得非常重要,他們負(fù)責(zé)訓(xùn)練驅(qū)動行業(yè)應(yīng)用智能體的核心大模型,并提供模型服務(wù)。

智能體與傳統(tǒng)系統(tǒng)之間的分工是,智能體完成專業(yè)的認(rèn)知任務(wù),而非認(rèn)知性的,程序化的任務(wù)則保留在傳統(tǒng)系統(tǒng)中,通過原有接口和工具執(zhí)行。在這種分工趨勢下,許多應(yīng)用系統(tǒng)都將朝著這個方向發(fā)展,智能體和傳統(tǒng)系統(tǒng)將共同協(xié)作,為用戶提供更加智能化的服務(wù)。

2 以 AI 大模型為核心的應(yīng)用系統(tǒng)關(guān)鍵實現(xiàn)路徑

實現(xiàn)以大模型為核心的企業(yè) IT 應(yīng)用系統(tǒng)的關(guān)鍵路徑可以分為以下幾個主要模塊。首先,我們需要進(jìn)行需求分析和方案設(shè)計,這是實現(xiàn)系統(tǒng)的第一步。接下來,在完成方案設(shè)計后,我們將并行進(jìn)行模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用系統(tǒng)的開發(fā)。在整個過程中,數(shù)據(jù)工程被視為核心,因此被放在中間位置。


具體來看,需求分析和方案設(shè)計階段與我們傳統(tǒng)的 IT 系統(tǒng)設(shè)計相似,但存在一些差異。首先,我們需要進(jìn)行可行性分析,這是任何項目啟動前的標(biāo)準(zhǔn)步驟。然后,我們要梳理模型的業(yè)務(wù)需求,這是確保模型能夠滿足實際業(yè)務(wù)需求的關(guān)鍵步驟。

接著是模型能力的定義,這一點與傳統(tǒng) IT 系統(tǒng)不同,需要明確系統(tǒng)的應(yīng)用場景,并梳理出哪些任務(wù)可以由模型執(zhí)行,哪些仍需依賴現(xiàn)有的 IT 系統(tǒng)。最獨特的地方在于評測體系的建立。

在傳統(tǒng)的 IT 系統(tǒng)中,我們通常通過測試用例來進(jìn)行測試,但現(xiàn)在我們需要構(gòu)建一套測試集來評估模型或基于模型的智能體,因為模型或基于模型的智能體的輸出并不是完全確定的。能夠成功完成任務(wù)的評估結(jié)果可能以百分比形式呈現(xiàn),一般而言都不是絕對的 100%。最后,我們需要確定總體的應(yīng)用方案,這是需求分析和方案設(shè)計階段的總結(jié)。


在實現(xiàn)以大模型為核心的企業(yè) IT 應(yīng)用系統(tǒng)中,模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用開發(fā)是三個關(guān)鍵環(huán)節(jié)。首先,我們來看數(shù)據(jù)工程。企業(yè)擁有大量數(shù)據(jù),但關(guān)鍵在于如何收集數(shù)據(jù)、判斷哪些數(shù)據(jù)有用。

這需要根據(jù)模型的能力需求來確定數(shù)據(jù)的方向。數(shù)據(jù)分為外部數(shù)據(jù)和內(nèi)部數(shù)據(jù),外部數(shù)據(jù)主要是行業(yè)通用的專業(yè)知識,需要有獲取渠道;內(nèi)部數(shù)據(jù)則是專業(yè)的業(yè)務(wù)數(shù)據(jù),需要盤點并進(jìn)行文檔預(yù)處理和數(shù)據(jù)集制作。文本數(shù)據(jù)和多模態(tài)數(shù)據(jù)的處理也包括在內(nèi)。

此外,如果應(yīng)用需要向量數(shù)據(jù)庫,就需要進(jìn)行數(shù)據(jù)拆分。如果向量模型的準(zhǔn)確率和召回率不高,還需要準(zhǔn)備微調(diào)數(shù)據(jù)。對于大型項目,可能還需要制作繼續(xù)訓(xùn)練的數(shù)據(jù)集和微調(diào)的指定數(shù)據(jù),甚至是人力對齊的數(shù)據(jù)。數(shù)據(jù)工程強調(diào)的是了解數(shù)據(jù)位置、盤點數(shù)據(jù)以及獲取外部專業(yè)數(shù)據(jù)的渠道。

接下來是模型訓(xùn)練,AI 大模型的應(yīng)用系統(tǒng)中模型訓(xùn)練常被首先提及,但實際上它并不是一個非常難的環(huán)節(jié),因為模型訓(xùn)練的方法在通用領(lǐng)域已有解決方案,我們只需遵循即可。模型訓(xùn)練有兩個分支:RAG 方向和 CPT(繼續(xù)預(yù)訓(xùn)練)或 SFT 方向。

RAG 方向的模型訓(xùn)練是指針對 Embedding 模型在專業(yè)領(lǐng)域性能下降的問題,需要使用企業(yè)專業(yè)數(shù)據(jù)進(jìn)行 Embedding 模型微調(diào)的訓(xùn)練。模型訓(xùn)練的關(guān)鍵在于模型的選型,需要根據(jù)業(yè)務(wù)場景選擇最合適的模型,并考慮模型在系統(tǒng)中的能力要求,選取適合評估相關(guān)能力的評測指標(biāo),并選擇評測指標(biāo)強的模型。

最后,使用準(zhǔn)備好的數(shù)據(jù)進(jìn)行模型訓(xùn)練,這個過程可能需要多輪迭代,如果評測結(jié)果不佳,可能需要回到數(shù)據(jù)層面解決能力問題。


最后是智能體應(yīng)用的開發(fā),這與傳統(tǒng)模式有所不同。需要根據(jù)需求明確智能體應(yīng)用的功能,設(shè)計整體架構(gòu),以及執(zhí)行流程,可能是順序執(zhí)行或?qū)蛹増?zhí)行。同時,需要提出智能體核心模型的需求,并設(shè)計和管理提示詞庫,建議統(tǒng)一管理提示詞并進(jìn)行集中評測和優(yōu)化。記憶體的設(shè)計也非常關(guān)鍵。

在完成這些準(zhǔn)備工作后,將流程串聯(lián)起來,實現(xiàn)智能體與現(xiàn)有 IT 系統(tǒng)的對接,并進(jìn)行測試評估。這不僅僅是軟件測試,更多的是評估智能體是否達(dá)標(biāo),如果不達(dá)標(biāo),可能需要進(jìn)行迭代優(yōu)化。

最后要說明的一點是,智能體應(yīng)用的發(fā)展目前剛剛起步,各種框架實現(xiàn)群雄逐鹿,生產(chǎn)環(huán)境可用性需要開發(fā)團(tuán)隊有很大的耐心去試錯填坑,并且智能體應(yīng)用的工程化實現(xiàn)的思路和傳統(tǒng)軟件工程化實現(xiàn)思路差異還是比較大的,這也是未來智能體應(yīng)用開發(fā)者們要解決的問題。

在完成模型訓(xùn)練、數(shù)據(jù)工程和智能體應(yīng)用開發(fā)這三個關(guān)鍵任務(wù)之后,我們進(jìn)入最后的部署階段。這包括模型的生產(chǎn)部署、檢索正向庫的構(gòu)建、智能應(yīng)用體的生產(chǎn)系統(tǒng)集成,以及系統(tǒng)的上線。

項目完成后,我們可以進(jìn)行 demo 展示或者實現(xiàn)項目的結(jié)算結(jié)項,這是整個實現(xiàn)路徑的最終步驟。


上述所有這些實現(xiàn)過程與傳統(tǒng)的 IT 系統(tǒng)實現(xiàn)有著相似之處。我們需要定義系統(tǒng)的能力,即需求,從模型的能力出發(fā)去訓(xùn)練模型。

以一個具體的例子來說,如果我們要在醫(yī)療行業(yè)應(yīng)用大模型,我們不僅需要通用的語言能力和安全價值觀,還需要將醫(yī)療業(yè)務(wù)能力整合進(jìn)去。這種業(yè)務(wù)能力是層級性的,需要逐步分解。

從最頂層開始,逐步細(xì)化,直至分解為一個個具體任務(wù)。每個任務(wù)對應(yīng)需要的數(shù)據(jù)類型和評測性能的標(biāo)準(zhǔn)。

總之,我們需要從能力出發(fā)選擇合適的模型,根據(jù)能力需求收集或制作訓(xùn)練數(shù)據(jù),并指導(dǎo)模型訓(xùn)練。這個過程要求我們不僅要關(guān)注技術(shù)實現(xiàn),還要深入理解業(yè)務(wù)需求,確保大模型能夠真正融入并提升企業(yè)的 IT 系統(tǒng)能力。

3 總結(jié)

對于企業(yè) IT 系統(tǒng)的未來,它肯定會朝著以大模型為核心的應(yīng)用體系架構(gòu)發(fā)展。大模型的能力決定了我們系統(tǒng)的能力上限,因此我們的評測也主要是針對模型的能力來進(jìn)行。

多智能體系統(tǒng)的開發(fā)和應(yīng)用將拓展大模型的能力,不再局限于簡單的問答,而是與 IT 系統(tǒng)聯(lián)動,極大擴展模型的能力。我們需要以用戶助理的視角來理解新的業(yè)務(wù)和技術(shù)特點,而不僅僅是作為開發(fā)者解決用戶的功能需求。

對于關(guān)鍵路徑而言,需求和業(yè)務(wù)場景是引領(lǐng)整個關(guān)鍵路徑的核心。工程、數(shù)據(jù)工程、模型訓(xùn)練以及多智能體應(yīng)用開發(fā)需要齊頭并進(jìn),其中業(yè)務(wù)場景和數(shù)據(jù)工程可能在企業(yè)應(yīng)用智能化改造的前期過程中是最為重要的。

AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯(lián)動,全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合,匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票,一同探索 AI 應(yīng)用邊界!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
湖北17歲女孩高考前確診腦死亡,父母簽完器官捐贈,突然接到來電

湖北17歲女孩高考前確診腦死亡,父母簽完器官捐贈,突然接到來電

坦然風(fēng)云
2025-06-02 10:19:54
六一兒童節(jié),與自己和解,不負(fù)時光

六一兒童節(jié),與自己和解,不負(fù)時光

大劉說說
2025-06-01 11:55:18
太原一輛路虎車有沖撞行為,路人紛紛避讓,警方:已接到報警,正在調(diào)查

太原一輛路虎車有沖撞行為,路人紛紛避讓,警方:已接到報警,正在調(diào)查

極目新聞
2025-06-02 11:41:48
徐璐蕾絲深v,太欲了

徐璐蕾絲深v,太欲了

吃瓜黨二號頭目
2025-06-02 10:17:22
2年8000萬!哈登續(xù)約引爆NBA多米諾效應(yīng):太陽截胡 三球入局

2年8000萬!哈登續(xù)約引爆NBA多米諾效應(yīng):太陽截胡 三球入局

陳陳說
2025-06-01 20:26:14
胡杏兒在上海浦東嘉里城,給小眾品牌做代言,站在店門口像售貨員

胡杏兒在上海浦東嘉里城,給小眾品牌做代言,站在店門口像售貨員

南南說娛
2025-06-02 11:49:34
廣東獵德村劃龍舟征婚小伙后續(xù),獵德村發(fā)現(xiàn)大量美女,應(yīng)該圓滿

廣東獵德村劃龍舟征婚小伙后續(xù),獵德村發(fā)現(xiàn)大量美女,應(yīng)該圓滿

跳跳歷史
2025-06-02 14:05:36
鄭大第一附屬醫(yī)院蛀蟲闞全程,網(wǎng)友曝光他的全部,令人瞠目結(jié)舌

鄭大第一附屬醫(yī)院蛀蟲闞全程,網(wǎng)友曝光他的全部,令人瞠目結(jié)舌

平老師666
2025-06-02 12:04:47
6月以后,大家提前做好準(zhǔn)備,若不出意外,國內(nèi)或?qū)⒂瓉磉@5個變化

6月以后,大家提前做好準(zhǔn)備,若不出意外,國內(nèi)或?qū)⒂瓉磉@5個變化

平說財經(jīng)
2025-06-02 11:49:21
降息后存款大逃亡? 90 后搬空銀行,錢都去哪兒了?

降息后存款大逃亡? 90 后搬空銀行,錢都去哪兒了?

平說財經(jīng)
2025-06-02 11:47:36
俄大橋被炸毀,平民死傷慘重,普京終于醒悟:最可怕的人就在身邊

俄大橋被炸毀,平民死傷慘重,普京終于醒悟:最可怕的人就在身邊

文雅筆墨
2025-06-02 15:03:14
70歲以后,如果想再多活20年,就要做好這5點

70歲以后,如果想再多活20年,就要做好這5點

生活不過如此呀
2025-05-09 23:20:03
豐田CEO:這款發(fā)動機將終結(jié)電動汽車,混動技術(shù)卷起效率

豐田CEO:這款發(fā)動機將終結(jié)電動汽車,混動技術(shù)卷起效率

Hi秒懂科普
2025-06-02 13:59:03
1.98萬輛!建議吉利把極氪砍掉算了,壯士斷臂,再造成功夢

1.98萬輛!建議吉利把極氪砍掉算了,壯士斷臂,再造成功夢

說說史事
2025-06-02 10:13:59
韓國大選候選人表示:金文洙已經(jīng)輸了!即使單一化也沒有勝算!

韓國大選候選人表示:金文洙已經(jīng)輸了!即使單一化也沒有勝算!

平祥生活日志
2025-06-02 09:24:13
香會結(jié)束,美防長離開新加坡,臨走前提出3個要求,中方絕不接受

香會結(jié)束,美防長離開新加坡,臨走前提出3個要求,中方絕不接受

博覽歷史
2025-06-02 10:53:40
穿鯊魚褲的女人,到底有多殺?

穿鯊魚褲的女人,到底有多殺?

健身廚屋
2025-06-02 13:18:02
悲催!黃埔一市民因打麻將賭博,被拘留5天罰款500,端午節(jié)錯過了

悲催!黃埔一市民因打麻將賭博,被拘留5天罰款500,端午節(jié)錯過了

火山詩話
2025-06-02 06:03:54
雷霆和步行者的主場相距688.4公里 自1971年來總決賽雙方最短距離

雷霆和步行者的主場相距688.4公里 自1971年來總決賽雙方最短距離

直播吧
2025-06-02 07:27:05
6月起,養(yǎng)老金調(diào)整通知將迎來公布,工齡20-35年,漲100-200元嗎

6月起,養(yǎng)老金調(diào)整通知將迎來公布,工齡20-35年,漲100-200元嗎

虎哥閑聊
2025-06-02 08:23:54
2025-06-02 16:16:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11142文章數(shù) 51279關(guān)注度
往期回顧 全部

科技要聞

新造車5月再洗牌:問界回前三,小米守第五

頭條要聞

美財長放話:美國永不會債務(wù)違約 我們不會公布"X日"

頭條要聞

美財長放話:美國永不會債務(wù)違約 我們不會公布"X日"

體育要聞

傲了一輩子的恩里克,心中永遠(yuǎn)住著一個小天使

娛樂要聞

章子怡深夜曬娃,兒女正面照曝光

財經(jīng)要聞

三大利空,突襲!

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態(tài)度原創(chuàng)

數(shù)碼
教育
家居
時尚
軍事航空

數(shù)碼要聞

機械革命筆記本新模具曝光,提供藍(lán)白撞色設(shè)計

教育要聞

解方程,學(xué)會方法真的很簡單

家居要聞

原木純白 邂逅自然本真

后背小心機!4款鏤空單品讓你美得毫不費力

軍事要聞

中國記者拿著美菲勾結(jié)證據(jù)對質(zhì) 菲律賓防長當(dāng)場急了

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 莎车县| 濮阳县| 个旧市| 凤庆县| 赣州市| 渭源县| 湘潭县| 清水县| 斗六市| 柳河县| 万宁市| 武隆县| 郁南县| 囊谦县| 区。| 响水县| 山东省| 栖霞市| 武穴市| 贵定县| 富民县| 中山市| 扶沟县| 修水县| 涟源市| 商河县| 晋州市| 吉隆县| 蓝山县| 霍山县| 通州区| 龙陵县| 南城县| 陈巴尔虎旗| 衡东县| 尚义县| 当雄县| 洞口县| 双江| 深圳市| 靖州|