沒有強大的數(shù)據(jù)安全保障,公司無法充分發(fā)揮數(shù)據(jù)的價值。隨著數(shù)據(jù)泄露事件逐年增多,每家公司都希望應(yīng)用 AI,這使得對數(shù)據(jù)進行妥善保護變得尤為重要。缺乏嚴密的數(shù)據(jù)安全措施,公司不僅有可能在不經(jīng)意間將敏感數(shù)據(jù)暴露給 AI 模型,還可能在數(shù)據(jù)泄露事件中丟失敏感信息,以及面臨其他潛在風險。雖然數(shù)據(jù)安全一直是重中之重,但在我們所處的 AI 時代,企業(yè)必須采用先進的數(shù)據(jù)保護技術(shù)。
為了確保數(shù)據(jù)得到充分保護,必須構(gòu)建一個完整的安全方法和控制措施生態(tài)系統(tǒng)。在多種數(shù)據(jù)保護技術(shù)中,Tokenization 是一種強有力的方法,它能夠替換真實數(shù)據(jù)為格式保持不變的 Token,從而在不降低數(shù)據(jù)使用價值的前提下保護數(shù)據(jù)中的敏感部分。
Capital One 意識到 Tokenization 的優(yōu)勢,因此開始了一段多年的 Tokenization 之旅。我們構(gòu)建了一個能夠以業(yè)務(wù)所需的速度與規(guī)模運行的 Tokenization 引擎,如今在數(shù)百個應(yīng)用中擁有數(shù)十億條已 Token 化的記錄。作為一家大規(guī)模運營的銀行,我們認為 Tokenization 是進一步保護敏感數(shù)據(jù)的高杠桿手段。
數(shù)據(jù)安全始于數(shù)據(jù)管理
為了有效保護數(shù)據(jù),首先必須對數(shù)據(jù)進行有效管理。這意味著要準確了解你擁有哪些數(shù)據(jù),它們存儲在哪里,屬于誰,以及如何被使用。因此,建立一個全面的數(shù)據(jù)清單是構(gòu)建安全數(shù)據(jù)生態(tài)系統(tǒng)的首要步驟。數(shù)據(jù)負責人應(yīng)首先對信息資產(chǎn)進行編目和分類:識別出“皇冠上的明珠”(最敏感或最有價值的數(shù)據(jù)),了解誰在使用這些數(shù)據(jù)以及具體如何使用。
數(shù)據(jù)安全與保護團隊可以利用這些信息,根據(jù)每個數(shù)據(jù)集的敏感程度和使用場景定制防護措施。例如,某些數(shù)據(jù)可能只需要嚴格的訪問控制和監(jiān)控,而高度敏感的信息則需要更強的防御措施,如 Tokenization。這一基礎(chǔ)工作對于確保數(shù)據(jù)既能得到充分保護,又能讓有權(quán)限的人便捷地查找和使用至關(guān)重要。
Tokenization 如何增強數(shù)據(jù)安全
Tokenization 在保持數(shù)據(jù)結(jié)構(gòu)和一定統(tǒng)計特性的同時,確保了數(shù)據(jù)的實用性,從而幫助降低敏感數(shù)據(jù)泄露的風險。該技術(shù)用一個與原數(shù)據(jù)格式相同的隨機 Token 替換敏感數(shù)據(jù)元素 —— 例如信用卡號碼或社會保障號碼。這種方法可以縮小潛在網(wǎng)絡(luò)攻擊的影響范圍,因為它降低了對不法分子而言,已 Token 化敏感數(shù)據(jù)的價值。授權(quán)用戶仍然可以在其環(huán)境中傳遞 Token 化的數(shù)據(jù) —— 甚至管理與第三方的數(shù)據(jù)共享 —— 從而實現(xiàn)業(yè)務(wù)價值。
Token 在特定上下文之外沒有任何意義,并且在沒有原始映射訪問權(quán)限的情況下無法逆向還原。這意味著 Tokenization 還可以幫助確保敏感數(shù)據(jù)不被暴露給 AI 模型。隨著 AI 模型越來越依賴大型、復雜的數(shù)據(jù)集,這一措施為數(shù)據(jù)泄露提供了關(guān)鍵防護。
有人擔心更嚴格的安全措施會減緩創(chuàng)新步伐。而實際上,現(xiàn)代數(shù)據(jù)保護方法如 Tokenization 加上智能流程自動化設(shè)計,旨在將摩擦降到最低。在 Capital One,我們發(fā)現(xiàn)對部分數(shù)據(jù)進行 Tokenization 后,開發(fā)者能夠更自由地協(xié)作,因為敏感細節(jié)已經(jīng)得到了有效屏蔽。當措施得當時,數(shù)據(jù)安全不僅不會抑制創(chuàng)新,反而能使數(shù)據(jù)在確保強有力防護的前提下變得更有價值。
數(shù)據(jù)安全作為創(chuàng)新的杠桿
要實現(xiàn)數(shù)據(jù)的充分保護沒有單一的解決方案,但 Tokenization 對于希望在大規(guī)模保護敏感數(shù)據(jù)的企業(yè)來說,仍是一種寶貴的方法。它與細粒度訪問控制、恰當應(yīng)用的加密和持續(xù)監(jiān)控等其他措施協(xié)同作用效果最佳。但作為分層防御的一部分,Tokenization 是一枚強有力的關(guān)鍵環(huán)節(jié),即使在新威脅出現(xiàn)時也能保持有效。
歸根結(jié)底,在不犧牲安全前提下推動數(shù)據(jù)創(chuàng)新是釋放業(yè)務(wù)價值的關(guān)鍵。受到我們自身歷程的啟發(fā),我們正在通過 Capital One Databolt —— 一種無保險庫的 Tokenization 解決方案,幫助公司利用 Tokenization 的強大優(yōu)勢,在大規(guī)模場景下保護敏感數(shù)據(jù)。借助 Databolt,企業(yè)可以在建立應(yīng)用及 AI 模型時確信其敏感數(shù)據(jù)已通過 Tokenization 得到更好的防護,避免潛在泄露風險。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.