NVIDIA攜Google Cloud，帶給企業(yè)代理型AI推理功能

2025-04-11 15:34:46　來源: 十輪網(wǎng)

山東舉報(bào)

分享至

NVIDIA與Google Cloud合作，運(yùn)用Blackwell HGX and DGX平臺及NVIDIA機(jī)密運(yùn)算（NVIDIA Confidential Computing）技術(shù)保護(hù)數(shù)據(jù)安全，并將代理型AI（agentic AI）帶給尋求當(dāng)?shù)囟耸褂肎oogle Gemini系列AI模型的企業(yè)。

通過搭載Blackwell平臺的Google分布式云計(jì)算（Google Distributed Cloud，GDC），企業(yè)的地端數(shù)據(jù)中心可以鎖定訪問病患記錄、金融交易和政府機(jī)密資訊等機(jī)密敏感資訊的權(quán)限，以符合法規(guī)要求和數(shù)據(jù)主權(quán)法令。NVIDIA機(jī)密運(yùn)算技術(shù)還能保護(hù)Gemini模型中的敏感程序代碼，避免未經(jīng)授權(quán)的訪問與數(shù)據(jù)外流。

Google Cloud基礎(chǔ)設(shè)施與解決方案部門副總裁暨總經(jīng)理Sachin Gupta表示，借由將Gemini模型與NVIDIA Blackwell的突破性性能及機(jī)密運(yùn)算能力相結(jié)合，讓企業(yè)能夠充分發(fā)揮代理型AI的潛力。這項(xiàng)合作有助于確保客戶能夠在不影響性能或操作便利性的情況下，安全地進(jìn)行創(chuàng)新。

NVIDIA Blackwell的機(jī)密運(yùn)算技術(shù)能為企業(yè)提供技術(shù)保障，包括Gemini模型應(yīng)用程序界面的用戶提示及用于微調(diào)的數(shù)據(jù)，都能保持安全，無法被查看或修改。與此同時(shí)，模型所有者可以防止未經(jīng)授權(quán)的訪問或篡改，提供雙重保護(hù)，讓企業(yè)能夠在維護(hù)數(shù)據(jù)隱私的同時(shí)，利用Gemini模型進(jìn)行創(chuàng)新。

有別于根據(jù)學(xué)習(xí)到的知識來感知或生成內(nèi)容的AI模型，代理型AI系統(tǒng)可以在動態(tài)環(huán)境中進(jìn)行推理、適應(yīng)與決策。例如在企業(yè)IT支持方面，以知識為基礎(chǔ)的AI模型可以檢索與提供故障排除指南，而代理型AI系統(tǒng)則能夠自主診斷問題、執(zhí)行修復(fù)，以及將復(fù)雜的問題呈報(bào)到更高層級進(jìn)行處理。

同樣地，在金融領(lǐng)域，傳統(tǒng)的AI模型可以根據(jù)既有模式標(biāo)示潛在的欺詐交易活動，代理型AI系統(tǒng)則能更進(jìn)一步調(diào)查異常情況，并主動采取行動，例如在交易發(fā)生前即進(jìn)行封鎖，或是即時(shí)調(diào)整欺詐偵測規(guī)則。

Google Cloud也宣布推出全新的GKE Inference Gateway，借由先進(jìn)的路由和擴(kuò)展性來優(yōu)化部署AI推論工作負(fù)載的部署。通過與NVIDIA Triton推論服務(wù)器及NVIDIA NeMo Guardrails集成，GKE Inference Gateway可提供智能負(fù)載均衡，以提升性能與降低服務(wù)成本，同時(shí)實(shí)現(xiàn)模型安全與治理活動的集中化管控。

預(yù)期未來，Google Cloud正致力于集成專為跨AI工廠服務(wù)與擴(kuò)展推理AI模型而打造的開源函數(shù)庫NVIDIA Dynamo，以提高代理型AI工作負(fù)載的可觀察性。

（首圖來源：NVIDIA）

#英偉達(dá)# #代理模式# #推理# #人工智能#

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.