NVIDIA與Google Cloud合作,運(yùn)用Blackwell HGX and DGX平臺及NVIDIA機(jī)密運(yùn)算(NVIDIA Confidential Computing)技術(shù)保護(hù)數(shù)據(jù)安全,并將代理型AI(agentic AI)帶給尋求當(dāng)?shù)囟耸褂肎oogle Gemini系列AI模型的企業(yè)。
通過搭載Blackwell平臺的Google分布式云計(jì)算(Google Distributed Cloud,GDC),企業(yè)的地端數(shù)據(jù)中心可以鎖定訪問病患記錄、金融交易和政府機(jī)密資訊等機(jī)密敏感資訊的權(quán)限,以符合法規(guī)要求和數(shù)據(jù)主權(quán)法令。NVIDIA機(jī)密運(yùn)算技術(shù)還能保護(hù)Gemini模型中的敏感程序代碼,避免未經(jīng)授權(quán)的訪問與數(shù)據(jù)外流。
Google Cloud基礎(chǔ)設(shè)施與解決方案部門副總裁暨總經(jīng)理Sachin Gupta表示,借由將Gemini模型與NVIDIA Blackwell的突破性性能及機(jī)密運(yùn)算能力相結(jié)合,讓企業(yè)能夠充分發(fā)揮代理型AI的潛力。這項(xiàng)合作有助于確保客戶能夠在不影響性能或操作便利性的情況下,安全地進(jìn)行創(chuàng)新。
NVIDIA Blackwell的機(jī)密運(yùn)算技術(shù)能為企業(yè)提供技術(shù)保障,包括Gemini模型應(yīng)用程序界面的用戶提示及用于微調(diào)的數(shù)據(jù),都能保持安全,無法被查看或修改。與此同時(shí),模型所有者可以防止未經(jīng)授權(quán)的訪問或篡改,提供雙重保護(hù),讓企業(yè)能夠在維護(hù)數(shù)據(jù)隱私的同時(shí),利用Gemini模型進(jìn)行創(chuàng)新。
有別于根據(jù)學(xué)習(xí)到的知識來感知或生成內(nèi)容的AI模型,代理型AI系統(tǒng)可以在動態(tài)環(huán)境中進(jìn)行推理、適應(yīng)與決策。例如在企業(yè)IT支持方面,以知識為基礎(chǔ)的AI模型可以檢索與提供故障排除指南,而代理型AI系統(tǒng)則能夠自主診斷問題、執(zhí)行修復(fù),以及將復(fù)雜的問題呈報(bào)到更高層級進(jìn)行處理。
同樣地,在金融領(lǐng)域,傳統(tǒng)的AI模型可以根據(jù)既有模式標(biāo)示潛在的欺詐交易活動,代理型AI系統(tǒng)則能更進(jìn)一步調(diào)查異常情況,并主動采取行動,例如在交易發(fā)生前即進(jìn)行封鎖,或是即時(shí)調(diào)整欺詐偵測規(guī)則。
Google Cloud也宣布推出全新的GKE Inference Gateway,借由先進(jìn)的路由和擴(kuò)展性來優(yōu)化部署AI推論工作負(fù)載的部署。通過與NVIDIA Triton推論服務(wù)器及NVIDIA NeMo Guardrails集成,GKE Inference Gateway可提供智能負(fù)載均衡,以提升性能與降低服務(wù)成本,同時(shí)實(shí)現(xiàn)模型安全與治理活動的集中化管控。
預(yù)期未來,Google Cloud正致力于集成專為跨AI工廠服務(wù)與擴(kuò)展推理AI模型而打造的開源函數(shù)庫NVIDIA Dynamo,以提高代理型AI工作負(fù)載的可觀察性。
(首圖來源:NVIDIA)
#英偉達(dá)# #代理模式# #推理# #人工智能#
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.