沒有安全,數(shù)據(jù)流通就無從談起;沒有流通,數(shù)據(jù)就難以賦能千行百業(yè)。
5月10日,以“數(shù)智無界 安全共生”為主題的2025中國(guó)數(shù)谷·西湖論劍大會(huì)在杭州開幕。
中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)原理事長(zhǎng)、CCF計(jì)算機(jī)博物館館長(zhǎng)梅宏在大會(huì)主論壇上提到,沒有數(shù)據(jù)就不可能有智能,就像燃料和火箭的關(guān)系一樣。現(xiàn)在業(yè)界經(jīng)常講本輪AI革命的三要素:算法、數(shù)據(jù)、算力,實(shí)際上數(shù)據(jù)是關(guān)鍵。
推動(dòng)AI(人工智能)向AGI(通用人工智能)演進(jìn),數(shù)據(jù)與AI的深度融合非常重要,但現(xiàn)在缺乏高質(zhì)量的數(shù)據(jù)集致數(shù)據(jù)流通受限,這是不是一個(gè)關(guān)鍵的堵點(diǎn)?
對(duì)于《每日經(jīng)濟(jì)新聞》記者提出的這一問題,安恒信息技術(shù)股份有限公司(SH688023,股價(jià)49.18元,總市值50.30億元,以下簡(jiǎn)稱安恒信息)高級(jí)副總裁、研究院院長(zhǎng)王欣表示,數(shù)據(jù)的流通受限確實(shí)是一個(gè)關(guān)鍵問題。
私有數(shù)據(jù)是讓模型落地到場(chǎng)景里發(fā)揮價(jià)值的關(guān)鍵因素
王欣對(duì)《每日經(jīng)濟(jì)新聞》記者表示,整個(gè)模型從構(gòu)建到應(yīng)用落地分為兩個(gè)方面:一方面,現(xiàn)在“大廠”做一些基礎(chǔ)的通用模型訓(xùn)練,更多用到的是互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù)。這里存在一些具體數(shù)據(jù)層面的安全問題,主要是數(shù)據(jù)質(zhì)量問題,這影響了模型本身的能力,也有反映網(wǎng)絡(luò)空間數(shù)據(jù)不夠用的聲音,所以業(yè)內(nèi)目前也在做很多合成數(shù)據(jù)。
王欣接受采訪 每經(jīng)記者 張蕊 攝
另一方面,更為重要的是模型在具體場(chǎng)景中應(yīng)該如何有效利用,如何能更深刻地理解行業(yè)、理解場(chǎng)景。“在內(nèi)容方面,互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù)可能完全不夠用,因?yàn)橛泻芏嗨接虻膱?chǎng)景,具有行業(yè)的特性,這些數(shù)據(jù)并不在網(wǎng)絡(luò)空間內(nèi)存在。”王欣表示,業(yè)內(nèi)曾有很多討論,認(rèn)為AGI來了可能就不再需要垂域模型,但其實(shí)不然。
“我認(rèn)為通用模型永遠(yuǎn)代替不了垂域場(chǎng)景的模型,因?yàn)榇褂驁?chǎng)景有很多私有數(shù)據(jù),私有數(shù)據(jù)是真正讓模型落地到場(chǎng)景里發(fā)揮價(jià)值的關(guān)鍵因素。”他說,到整個(gè)模型應(yīng)用落地時(shí),數(shù)據(jù)的流通可能會(huì)成為促進(jìn)人工智能發(fā)展的一個(gè)關(guān)鍵環(huán)節(jié)。
安恒信息董事長(zhǎng)范淵在大會(huì)主論壇上提到,可信數(shù)據(jù)空間是破解數(shù)據(jù)要素開發(fā)利用與安全防護(hù)矛盾的關(guān)鍵。AI原生可信數(shù)據(jù)空間可以實(shí)現(xiàn)可信數(shù)據(jù)空間與AI的雙向賦能。
可信數(shù)據(jù)空間通過“軟硬結(jié)合”保證數(shù)據(jù)全流程安全可控
那么,可信數(shù)據(jù)空間對(duì)數(shù)據(jù)的安全流通、使用可以起到怎樣的作用?
對(duì)此,安恒信息CTO(首席技術(shù)官)劉博在接受《每日經(jīng)濟(jì)新聞》記者現(xiàn)場(chǎng)采訪時(shí)表示,可信數(shù)據(jù)空間包含了兩個(gè)部分:一部分是數(shù)據(jù)如何流通,包括整個(gè)架構(gòu),里面有連接器、數(shù)由器、平臺(tái)、隱私計(jì)算等,而平臺(tái)中包含了很多功能,如數(shù)據(jù)目錄、鑒權(quán)、審計(jì)、定價(jià)、數(shù)據(jù)交付等,圍繞數(shù)據(jù)要素流通定義了很多標(biāo)準(zhǔn)模塊和功能。
劉博接受采訪 每經(jīng)記者 張蕊 攝
還有一部分是安全,尤其是動(dòng)態(tài)數(shù)據(jù)安全,數(shù)據(jù)在流通過程中定義為靜態(tài)數(shù)據(jù)安全的思路已經(jīng)行不通了,目前正處在向動(dòng)態(tài)安全轉(zhuǎn)變的過程中,用以保證數(shù)據(jù)安全。
劉博舉例說,比如杭州探索出的“三數(shù)一鏈”,這可以視為一個(gè)可信數(shù)據(jù)空間先行先試的成果。因?yàn)榭尚艛?shù)據(jù)空間可以有不同的形態(tài),現(xiàn)在技術(shù)路線也沒有完全定下來,允許幾條技術(shù)路線并行,大家都在進(jìn)行嘗試探索,“三數(shù)一鏈”是目前走在最靠前的技術(shù)路線之一,是可信數(shù)據(jù)空間落地化的載體。
談及建設(shè)可信數(shù)據(jù)空間過程中如何保證安全,自然資源部第二海洋研究所所長(zhǎng)方銀霞在接受包括《每日經(jīng)濟(jì)新聞》在內(nèi)的媒體采訪時(shí)表示,可信數(shù)據(jù)空間是國(guó)家的一種數(shù)據(jù)流通利用基礎(chǔ)設(shè)施,國(guó)家數(shù)據(jù)局去年11月發(fā)布了可信數(shù)據(jù)空間的行動(dòng)計(jì)劃,計(jì)劃到2028年在全國(guó)建成100個(gè)以上可信數(shù)據(jù)空間。
“作為一個(gè)基礎(chǔ)設(shè)施,國(guó)家有相關(guān)的建設(shè)規(guī)范,數(shù)據(jù)安全問題主要有‘硬’和‘軟’兩類保障。硬技術(shù)來說,包含了接入連接器等設(shè)施,還有隱私保護(hù)計(jì)算、區(qū)塊鏈、數(shù)據(jù)沙箱、可信執(zhí)行環(huán)境等多種數(shù)據(jù)流通技術(shù),來保證空間安全可信。”方銀霞說,而在“軟”的方面,會(huì)建立一整套規(guī)則規(guī)范。
她舉例說,在海洋可信數(shù)據(jù)空間方面,后期會(huì)發(fā)布50多個(gè)規(guī)則規(guī)范,包含了用戶和數(shù)據(jù)準(zhǔn)入認(rèn)證、數(shù)據(jù)應(yīng)用場(chǎng)景審查以及流通使用、爭(zhēng)議仲裁、收益分配等,會(huì)從全流程進(jìn)行數(shù)據(jù)可信管控。“我們依照國(guó)家數(shù)據(jù)流通基礎(chǔ)設(shè)施的規(guī)范來建設(shè),從技術(shù)和規(guī)則兩方面軟硬結(jié)合,保證全流程的安全可控。”
AI在數(shù)據(jù)分類分級(jí)等方面有很大應(yīng)用空間
王欣表示,解決數(shù)據(jù)流通過程中的安全問題,需要由靜態(tài)安全思路向動(dòng)態(tài)安全轉(zhuǎn)變,在這個(gè)過程中,AI可以發(fā)揮很大作用。
他進(jìn)一步表示,AI非常容易理解文本數(shù)據(jù),比如用DeepSeek或者KIMI,給它文本,它的分析總結(jié)能力很強(qiáng)。所以AI技術(shù)甚至比人更懂?dāng)?shù)據(jù),它可以讀懂是什么樣的數(shù)據(jù)、有什么樣的意義和價(jià)值。
另外,在流通過程中,AI也可以識(shí)別業(yè)務(wù)行為。王欣舉例說,原來有API(應(yīng)用程序接口)安全問題,API接口是數(shù)據(jù)流通的關(guān)鍵載體,但在流通過程中,API接口是什么用途、背后承載了哪些數(shù)據(jù)的流通,靠傳統(tǒng)的軟件技術(shù)無法識(shí)別,而AI可以理解其中API的接口定義以及參數(shù)、參數(shù)背后的內(nèi)容,可以在分析完之后識(shí)別API接口能起到什么樣的作用,大量的業(yè)務(wù)系統(tǒng)及人調(diào)用API接口時(shí)是正常行為還是異常行為。
“所以AI+數(shù)據(jù)安全是我們現(xiàn)在著力打造的AI落地場(chǎng)景,無論是在數(shù)據(jù)的分類分級(jí)還是在API安全方面,包括數(shù)據(jù)庫審計(jì)等,都有很大應(yīng)用空間。”王欣說。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.