作者:毛爍
如果說蒸汽機解放了人類的體力,計算機延伸了人類的腦力,那么在人工智能時代,我們正迎來一場更為深刻的變革——智能體(Agent)崛起下,其不再僅僅是工具,而是具備自主思考、決策和行動能力的智能“協(xié)作者”。
AI智能體并非簡單的腳本或自動化程序。其是高度集成的智能系統(tǒng)。想象一下,這是一個能夠理解自然語言指令、自主搜索并整合信息、進行邏輯判斷并采取行動的數(shù)字實體。
這些AI智能體可以“深入”企業(yè)的各個角落,承擔起此前需要大量人力投入的復(fù)雜任務(wù)。從財務(wù)報表的智能分析、市場數(shù)據(jù)的實時監(jiān)控,到客戶咨詢的個性化應(yīng)答、供應(yīng)鏈風險的預(yù)測預(yù)警,AI智能體展現(xiàn)出了驚人的效率和準確性 。
尤為值得關(guān)注的是,AI智能體正在從單體應(yīng)用走向協(xié)同化、系統(tǒng)化的“多智能體系統(tǒng)”架構(gòu)——數(shù)百個擁有不同專長和目標的AI智能體能夠無縫協(xié)作,共同完成復(fù)雜、跨部門的綜合性任務(wù) 。
AI智能體的強大能力并非一蹴而就,它們?nèi)缤跎纳枰谂c環(huán)境的交互中不斷學習和成長。而驅(qū)動這種成長的核心機制,便是“數(shù)據(jù)飛輪”——一個持續(xù)循環(huán)、自我強化的AI智能體優(yōu)化閉環(huán) 。
NVIDIA NeMo:為代理式 AI 構(gòu)建“數(shù)據(jù)飛輪”的三重數(shù)據(jù)流
在當前企業(yè)競相擁抱人工智能以驅(qū)動增長和效率的時代背景下,AI智能體在企業(yè)中正逐步扮演起“數(shù)字成員”的角色,它們需要持續(xù)、高質(zhì)量的數(shù)據(jù)輸入來維持和提升自身的理解能力和可靠性。
如果將智能體視為一個學徒,缺乏持續(xù)的指導(dǎo)和實踐(即數(shù)據(jù)),其技能(性能)必然停滯甚至退步。
NVIDIA NeMo微服務(wù)的正式全面推出,正是為了應(yīng)對這一挑戰(zhàn),為企業(yè)IT部門提供一個端到端、功能完備的開發(fā)者平臺。其核心目標是幫助企業(yè)快速組建并賦能其AI團隊,通過構(gòu)建和利用強大的“數(shù)據(jù)飛輪”,顯著提升員工的生產(chǎn)力。
NVIDIA NeMo 微服務(wù)擁有“端到端”的特性,能極大程度上加快AI智能體的開發(fā)、部署與管理流程。這些工具涵蓋了從數(shù)據(jù)策劃、模型定制、性能評估到安全防護的各個環(huán)節(jié)。
使用 NVIDIA NeMo 微服務(wù)構(gòu)建的數(shù)據(jù)飛輪不斷整理數(shù)據(jù)、重新訓練模型并評估其性能,整個過程幾乎無需人工干預(yù),實現(xiàn)了最大程度的自主性
(來源:NVIDIA)
但是,想讓生產(chǎn)環(huán)境中的AI智能體“不掉鏈子”,光靠訓練遠遠不夠,那只是“基礎(chǔ)溫飽”,還需要三類數(shù)據(jù)支持其“續(xù)命”:
推理數(shù)據(jù)是洞察模型在真實環(huán)境運行實況、并捕捉數(shù)據(jù)模式演變的關(guān)鍵,確保模型能夠動態(tài)適應(yīng);業(yè)務(wù)數(shù)據(jù)提供模型所需的最新的業(yè)務(wù)信息,確保其輸出的智能性與當下保持同步;而用戶反饋則直接驗證模型與應(yīng)用表現(xiàn)是否符合預(yù)期,是校驗效果和指導(dǎo)優(yōu)化的重要依據(jù)。
這三類數(shù)據(jù)是AI模型在生產(chǎn)環(huán)境中保持活力、實現(xiàn)持續(xù)迭代優(yōu)化的關(guān)鍵。NVIDIA NeMo微服務(wù)正是幫助開發(fā)者高效整合、管理并充分利用這三類數(shù)據(jù)的重要工具。
NVIDIA NeMo 微服務(wù)組合,包括 NeMo Customizer、NeMo Evaluator 和 NeMo Guardrails,與 NeMo Retriever 和 NeMo Curator 協(xié)同工作,共同構(gòu)建并為企業(yè)定制專屬的數(shù)據(jù)飛輪,從而簡化企業(yè)構(gòu)建、優(yōu)化和大規(guī)模擴展 AI智能體的復(fù)雜任務(wù)。
具體而言,NVIDIA NeMo Customizer專注于加速大語言模型的微調(diào)過程。它采用了業(yè)界主流且高效的后訓練技術(shù),如監(jiān)督微調(diào)(SFT)和低秩自適應(yīng)(LoRA),能夠?qū)⒂柧毻掏铝刻嵘哌_1.8倍,顯著縮短了模型針對特定企業(yè)數(shù)據(jù)的適應(yīng)周期。
NVIDIA NeMo Evaluator則極大地簡化了模型和工作流的評估流程,無論是自定義模型還是基于行業(yè)基準的評估,都只需通過五次應(yīng)用程序接口 (API) 調(diào)用即可完成,提高了評估效率和迭代速度。
而NVIDIA NeMo Guardrails微服務(wù),對于確保AI智能體的行為符合組織政策和安全準則至關(guān)重要,它能在僅增加額外半秒延遲的情況下,將合規(guī)性保護能力提高至多1.4倍,為企業(yè)實施強效的安全防護措施提供了堅實保障。
借助NVIDIA NeMo 微服務(wù)及其構(gòu)建的數(shù)據(jù)飛輪,開發(fā)者能夠顯著提升AI智能體的準確性和整體效率。這些微服務(wù)通過 NVIDIA AI Enterprise 軟件平臺部署,具備卓越的易操作性,并且可以在任何加速計算基礎(chǔ)設(shè)施上運行,無論是本地數(shù)據(jù)中心還是云端環(huán)境,都能提供企業(yè)級的安全性、穩(wěn)定性和強大的支持。
隨著企業(yè)業(yè)務(wù)復(fù)雜性的提升,構(gòu)建大規(guī)模多智能體系統(tǒng)已成為趨勢。在這樣的系統(tǒng)中,數(shù)百甚至數(shù)千個具有不同目標和工作流的專用智能體,作為“數(shù)字員工”,協(xié)同處理極其復(fù)雜的任務(wù),與人類員工并肩工作,實現(xiàn)跨職能的輔助和效率提升。
這好比高度自主分立協(xié)作的生命體,各個器官(智能體)各司其職,通過精密的協(xié)調(diào)(數(shù)據(jù)飛輪驅(qū)動的交互與學習)共同維系整體的健康運轉(zhuǎn)。
這種深遠的企業(yè)級影響使得 AI智能體被業(yè)界視為一個價值萬億美元的巨大商機,其應(yīng)用場景極為廣泛,涵蓋了從自動化欺詐檢測、智能購物助手、預(yù)測性機器維護到海量文檔自動審查等多個領(lǐng)域。
而這一切應(yīng)用的成功落地與規(guī)模化推廣,都突顯了“數(shù)據(jù)飛輪”在將企業(yè)業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)化為可操作、有價值的洞見,并驅(qū)動實際行為方面的關(guān)鍵作用。
這一過程中,NVIDIA NeMo 微服務(wù)正是賦能企業(yè)構(gòu)建并駕馭這一核心能力的關(guān)鍵工具。
精度與協(xié)同“和弦”:準確攀升+廣泛生態(tài)支持
從具體表現(xiàn)上看,NVIDIA NeMo微服務(wù)能夠顯著提高AI智能體的準確性、效率和成本效益,推動企業(yè)級 AI 應(yīng)用邁向新的高度,加速實現(xiàn)更智能、更高效的業(yè)務(wù)流程和用戶體驗。
鑒于此,NVIDIA NeMo 微服務(wù)正成為行業(yè)領(lǐng)導(dǎo)企業(yè)開發(fā)下一代 AI智能體的首選,更得益于廣泛的模型和合作伙伴生態(tài)系統(tǒng)的支持。目前,眾多領(lǐng)先企業(yè)正積極采用NVIDIA NeMo 微服務(wù)構(gòu)建高性能 AI 智能體平臺,以賦能團隊處理更復(fù)雜的工作。
他們在核心業(yè)務(wù)流程中的成功應(yīng)用,以及取得的顯著成果,也充分展現(xiàn)了NVIDIA NeMo 微服務(wù)在提高AI智能體準確性方面的強大效果。
具體來看,AT&T 與 Arize 和 Quantiphi 合作,利用 NVIDIA NeMo 構(gòu)建了先進的 AI 智能體,用于處理包含近10,000份文檔且每周更新的知識庫。這款可擴展的高性能 AI 智能體針對速度、成本效益和準確性這三大關(guān)鍵業(yè)務(wù)重點進行了微調(diào),隨著應(yīng)用規(guī)模的擴大,其重要性也與日俱增。
AT&T 通過使用NVIDIA NeMo Customizer 和 NVIDIA Evaluator對 Mistral 7B 模型進行微調(diào),成功將其準確率提高40%,極大地增強了其提供個性化服務(wù)、防止欺詐和優(yōu)化網(wǎng)絡(luò)性能的能力。
貝萊德 (BlackRock) 則在其通過通用數(shù)據(jù)語言統(tǒng)一投資管理流程的 Aladdin 技術(shù)平臺中集成了 NeMo 微服務(wù),以賦予代理式AI功能。
思科 Outshift 團隊與 Galileo 利用 NVIDIA NeMo 微服務(wù)打造的編碼助手,成功將工具選擇錯誤減少 40%,并將響應(yīng)時間加快了 10 倍。
此外,納斯達克正基于 NeMo Retriever 微服務(wù)和 NVIDIA NIM 微服務(wù)加速其生成式 AI 平臺,NeMo Retriever 的集成顯著增強了平臺的搜索能力,使準確率和響應(yīng)時間提高了 30%,并節(jié)省了成本。
這些來自行業(yè)頭部企業(yè)的實踐案例,有力地證明了 NeMo 微服務(wù)在提升 AI 智能體性能和效率方面的卓越成效。
其實,NVIDIA NeMo 微服務(wù)被廣泛應(yīng)用和采納,很大程度上歸功于其對業(yè)界眾多主流開放模型的廣泛支持,這些模型包括Llama、微軟 Phi 系列小型語言模型、Google Gemma、Mistral,以及在GTC 2025大會上發(fā)布的在科學推理、編碼和復(fù)雜數(shù)學基準測試中表現(xiàn)領(lǐng)先的NVIDIA Llama Nemotron Ultra。
NVIDIA方面透露,在繁榮的合作伙伴生態(tài)系統(tǒng)之下,Meta通過Llamastack實現(xiàn)深度集成,并利用NVIDIA NeMo的Customizer、Evaluator、Guardrails等服務(wù),順暢構(gòu)建并運行AI智能體工作流,從而有效賦能企業(yè)利用“數(shù)據(jù)飛輪”持續(xù)優(yōu)化模型表現(xiàn)、提升效率并降低成本。
目前,NVIDIA正基于NVIDIA NeMo微服務(wù),聯(lián)合各方力量推動AI智能體發(fā)展。通過與Dataiku、LangChain等主流工具深度集成來支持開發(fā)者;NeMo Retriever組件則與戴爾等數(shù)據(jù)平臺合作,將被SAP、ServiceNow等企業(yè)廣泛采用。這些智能體還將部署在思科、戴爾等提供的加速基礎(chǔ)設(shè)施上,埃森哲、德勤等咨詢公司也通過NeMo 微服務(wù)協(xié)助客戶構(gòu)建和實施方案。
而這一切能力和服務(wù),都可通過在NVIDIA NGC 目錄下載NVIDIA NeMo 微服務(wù)獲取。這些微服務(wù)在作為NVIDIA AI Enterprise 的一部分進行部署時,能夠提供長期穩(wěn)定的軟件分支,實現(xiàn) API穩(wěn)定性、主動安全修復(fù)和企業(yè)級支持。
AI智能體的崛起與數(shù)據(jù)飛輪的構(gòu)建,是技術(shù)的飛躍,更是AI形態(tài)的一次范式演進。
當數(shù)據(jù)不再是冰冷的集合,而成為智能體感知、學習、自我強化的“生命之血” 。數(shù)據(jù)飛輪的每一次旋轉(zhuǎn),都驅(qū)動著數(shù)字“協(xié)作者”向更高維度的智能攀升 。
或許,可以將NVIDIA NeMo微服務(wù)比喻為數(shù)據(jù)飛輪的機軸,從精煉數(shù)據(jù),到優(yōu)化模型,再到確保智能體在現(xiàn)實世界中“不輟學習”“精準行動”。自此,數(shù)據(jù)不再沉寂,而是轉(zhuǎn)化為可操作的洞見,驅(qū)動企業(yè)智能體的“內(nèi)功”精進,開啟了生產(chǎn)力“相變”的下一個階段。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.