隨著生成式AI技術(shù)的飛速發(fā)展,DeepSeek-R1等強(qiáng)大的大型語言模型正站在創(chuàng)新的最前沿。這些模型以其卓越的能力,為企業(yè)和開發(fā)者帶來了前所未有的機(jī)遇。
然而,當(dāng)DeepSeek-R1模型在Vectara HHEM AI幻覺測試中暴露出14.3%的”思維偏差”時?,整個生成式AI行業(yè)都聽到了安全警鐘的轟鳴。這場測試猶如一柄雙刃劍,既彰顯了開源模型在技術(shù)創(chuàng)新上的鋒芒,也暴露出企業(yè)級部署中潛藏的安全隱憂——就像一位技術(shù)極客在硅谷論壇所言:”AI幻覺如同數(shù)字時代的暗物質(zhì),看不見卻可能引發(fā)系統(tǒng)性崩塌”?。
安全攻防戰(zhàn):企業(yè)部署的”阿喀琉斯之踵”
在金融行業(yè),某銀行曾因AI客服的”創(chuàng)造性回答”導(dǎo)致客戶隱私泄露,最終付出數(shù)百萬美元的和解金?。這印證了生成式AI的幻覺問題絕非技術(shù)層面的”小感冒”,而是可能動搖企業(yè)根基的”數(shù)字地震”。
幻覺問題,即模型生成的內(nèi)容與原始證據(jù)不一致,是企業(yè)級AI部署中必須面對的一大難題。除此之外,還需要考慮潛在的安全風(fēng)險、導(dǎo)致誤導(dǎo)性的信息、數(shù)據(jù)隱私泄露,甚至觸犯合規(guī)紅線。當(dāng)模型擅自”腦補(bǔ)”缺失數(shù)據(jù)時,輕則輸出錯誤決策建議,重則觸發(fā)合規(guī)紅線——這種不確定性正在成為制約企業(yè)AI轉(zhuǎn)型的達(dá)摩克利斯之劍?。
對于像DeepSeek-R1這樣的開源模型而言,如何在保持其強(qiáng)大能力的同時,有效降低幻覺率,以及克服其他安全風(fēng)險,成為擺在企業(yè)面前的一道坎。
安全防護(hù)三重奏:從被動防御到主動免疫
為了應(yīng)對包括幻覺問題在內(nèi)的一系列挑戰(zhàn),亞馬遜云科技推出了生成式AI安全三部曲,旨在幫助企業(yè)級用戶安全、高效地部署和應(yīng)用DeepSeek等生成式AI模型。這三部曲包括基礎(chǔ)的安全防護(hù)、有害信息的過濾防護(hù),以及穩(wěn)健的深度防御策略。
基礎(chǔ)設(shè)施防護(hù):打造數(shù)字”防彈衣”?
亞馬遜云科技通過Amazon Bedrock等服務(wù)和工具,提供全面的安全功能,確保開源模型的安全托管和運(yùn)營。這些功能包括靜態(tài)數(shù)據(jù)和傳輸中數(shù)據(jù)加密、細(xì)粒度訪問控制、安全連接選項以及各種合規(guī)認(rèn)證。此外,亞馬遜云科技還對所有模型容器進(jìn)行漏洞掃描,并僅接受SafeTensors格式的模型,以防止不安全的代碼執(zhí)行。
- ?通過加密技術(shù),實現(xiàn)數(shù)據(jù)”隱身術(shù)”,讓敏感信息在靜態(tài)存儲和動態(tài)傳輸中始終處于加密狀態(tài)。
- ?權(quán)限控制?:構(gòu)建細(xì)粒度訪問控制體系,確保正確的人訪問正確的內(nèi)容,并確保每個操作都留下可追溯的”數(shù)字腳印”。
- ?容器消殺?:運(yùn)用AI驅(qū)動的漏洞掃描系統(tǒng),對模型容器進(jìn)行”體檢”,將安全隱患消滅在萌芽階段。
智能過濾網(wǎng):構(gòu)建認(rèn)知”防火墻”?
Amazon Bedrock Guardrails安全防護(hù)欄功能,為模型輸入和輸出提供了強(qiáng)大的過濾機(jī)制。包括內(nèi)容過濾、主題過濾、詞匯過濾、敏感信息過濾,以及上下文基礎(chǔ)檢查等多個方面,可調(diào)節(jié)有害內(nèi)容的過濾強(qiáng)度類別,限制特定主題以防止查詢和響應(yīng)中出現(xiàn)未經(jīng)授權(quán)的主題,屏蔽特定的詞匯,阻止個人信息查詢等。它就像數(shù)字世界的”免疫細(xì)胞”,能精準(zhǔn)識別98.7%的有害信息。
安全防護(hù)欄中的自動化推理功能可實現(xiàn)”思維透視”般的效果,當(dāng)檢測到與事實不符的幻覺出現(xiàn)時立即啟動”緊急修正”,避免出現(xiàn)事實性錯誤。這些功能使開發(fā)人員能夠?qū)嵤┒ㄖ频陌踩雷o(hù)措施,確保生成式AI應(yīng)用程序中的交互安全合規(guī)。
深度防御體系:鑄造生態(tài)級”金鐘罩”?
在基礎(chǔ)防護(hù)和安全防護(hù)欄體系之上,企業(yè)需要構(gòu)建完整的深度防護(hù)策略,以策萬全。但深度防御體系的構(gòu)建是一項系統(tǒng)工程,涵蓋企業(yè)架構(gòu)的韌性、全生命周期的安全設(shè)計、安全的云基礎(chǔ)架構(gòu)、分層防御策略以及信任邊界控制等多個方面。
盡管生成式AI帶來新的挑戰(zhàn),但云計算原有的經(jīng)典防御體系仍然有效,例如分層安全服務(wù)等,能夠幫助企業(yè)抵御很多常見的威脅。用戶應(yīng)當(dāng)在生成式AI工作負(fù)載及整個企業(yè)架構(gòu)中部署分層的亞馬遜云科技安全服務(wù),并關(guān)注數(shù)字供應(yīng)鏈中的集成點,以保障云環(huán)境的安全。
在使用的構(gòu)建工具端,亞馬遜云科技提供的Amazon SageMaker和Amazon Bedrock等AI/ML服務(wù)中涵蓋了的增強(qiáng)型安全和隱私功能,能夠為AI應(yīng)用增添更多層面的強(qiáng)化安全和隱私控制。這些工具從設(shè)計之初就融入安全考量,將使利用生成式AI進(jìn)行創(chuàng)新的過程更快、更容易且更具成本效益,同時簡化合規(guī)流程。
亞馬遜云科技建議企業(yè)定期審查和更新防護(hù)機(jī)制,并對所有安全控制措施進(jìn)行同樣操作,以應(yīng)對新出現(xiàn)的潛在漏洞,并在快速演變的AI安全環(huán)境中抵御新興威脅。通過將安全視為一個持續(xù)的評估、改進(jìn)和適應(yīng)過程,企業(yè)才能夠在保持強(qiáng)大安全控制的同時,自信地部署創(chuàng)新的AI解決方案。
安全新范式:從技術(shù)合規(guī)到價值創(chuàng)造
隨著越來越多的企業(yè)從思考階段進(jìn)入實踐階段,進(jìn)行大量的場景試驗,對AI模型的安全性和合規(guī)性要求也日益提高。亞馬遜云科技提供的安全防護(hù)三部曲,涵蓋基礎(chǔ)的安全防護(hù),有害內(nèi)容的過濾防護(hù),以及穩(wěn)健的深度防御策略,不僅為企業(yè)提供了全面的安全框架,還通過Amazon Bedrock等服務(wù),提供了模型推理運(yùn)行時所需的各種安全的生產(chǎn)力工具。這使得企業(yè)能夠更加自信地部署創(chuàng)新的AI解決方案,同時確保安全性和合規(guī)性。
正如亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建所說:“2024年我們看到許多客戶從思考階段進(jìn)入實踐階段,進(jìn)行了大量場景試驗。但是我覺得2025年肯定會發(fā)生一個變化,很多客戶將從原型驗證階段轉(zhuǎn)化為生產(chǎn)階段,這是必經(jīng)之路。屆時客戶需求將更加復(fù)雜,不僅是選擇模型,還需要各種技術(shù)支持。我們開發(fā)Amazon Bedrock的目的不僅是提供模型市場,更重要的是提供能讓模型推理運(yùn)行時所需的各種生產(chǎn)力工具和生產(chǎn)環(huán)境工具,這才是Amazon Bedrock的真正價值所在。”
在這場生成式AI的安全長跑中,亞馬遜云科技的三重防護(hù)體系正重新定義安全標(biāo)準(zhǔn)。當(dāng)其他廠商還在修補(bǔ)漏洞時,他們已開始構(gòu)建AI安全的”元宇宙”——在這里,安全不是成本中心,而是驅(qū)動數(shù)字化轉(zhuǎn)型的新引擎?。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.