數(shù)據(jù)正在成為非常關(guān)鍵的生產(chǎn)要素。
隨著大模型和AI的發(fā)展,高質(zhì)量數(shù)據(jù)成為模型訓(xùn)練應(yīng)用的基石,也是提升大模型準(zhǔn)確性、適應(yīng)性泛化能力的核心。以DeepSeekV3模型為例,就用了14.8萬億級的數(shù)據(jù)集進(jìn)行訓(xùn)練。
2025年是數(shù)字中國戰(zhàn)略實(shí)施十周年。技術(shù)的快速變革,使得高質(zhì)量數(shù)據(jù)集對人工智能發(fā)展、產(chǎn)業(yè)升級、社會進(jìn)步意義都進(jìn)一步提升,也成為了當(dāng)前數(shù)字經(jīng)濟(jì)建設(shè)的時代課題之一。
數(shù)據(jù)產(chǎn)業(yè)2030年將達(dá)7.5萬億元規(guī)模
5月17日在溫州舉行的2025數(shù)據(jù)安全發(fā)展大會上公布的數(shù)據(jù)顯示,2024年我國年度數(shù)據(jù)生產(chǎn)總量達(dá)41.06澤字節(jié),同比增長25%。數(shù)據(jù)領(lǐng)域相關(guān)企業(yè)超19萬家,數(shù)據(jù)產(chǎn)業(yè)規(guī)模超2萬億元。按照20%以上的年均增長率測算,2030年我國數(shù)據(jù)產(chǎn)業(yè)規(guī)模將達(dá)7.5萬億元。
在很多領(lǐng)域,數(shù)據(jù)都在發(fā)揮重要作用。
中國科學(xué)院院士徐濤表示,生命健康大數(shù)據(jù)能助力生物醫(yī)藥企業(yè)研發(fā)創(chuàng)新性的醫(yī)療產(chǎn)品,也能幫助企業(yè)大幅降本增效,是戰(zhàn)略必爭資源。由于生命健康大數(shù)據(jù)具有復(fù)雜性和敏感性的特征,需要構(gòu)建完善的數(shù)據(jù)安全體系,促進(jìn)高價值數(shù)據(jù)安全高效流動,合法合規(guī)運(yùn)營。
此外,城市治理、交通運(yùn)輸、醫(yī)療健康、科技創(chuàng)新等重點(diǎn)領(lǐng)域,以及大模型、人工智能、低空經(jīng)濟(jì)等,都是數(shù)據(jù)正在搭建、賦能或重塑的重要模塊。
同時,這些應(yīng)用領(lǐng)域也在反過來對數(shù)據(jù)質(zhì)量和價值提出更高的要求。會上發(fā)布的《2025高質(zhì)量數(shù)據(jù)集研究報告》顯示,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)產(chǎn)值已突破80億元,高質(zhì)量數(shù)據(jù)建設(shè)進(jìn)入規(guī)模化、規(guī)范化發(fā)展新階段。
隨著人工智能的新技術(shù)變革,高質(zhì)量數(shù)據(jù)集建設(shè)也得到了高度關(guān)注。國家數(shù)據(jù)局推進(jìn)了全國七個數(shù)據(jù)標(biāo)注基地建設(shè),構(gòu)建醫(yī)療、工業(yè)、教育等領(lǐng)域的335個高質(zhì)量數(shù)據(jù)集,標(biāo)注總規(guī)模達(dá)到1.7萬TB,支撐了121個國產(chǎn)大模型的研發(fā)。
中國電子信息產(chǎn)業(yè)發(fā)展研究院副總工程師劉權(quán)認(rèn)為,只有當(dāng)數(shù)據(jù)覆蓋足夠廣泛的場景并經(jīng)過專業(yè)標(biāo)注時,AI模型才能真正具備產(chǎn)業(yè)落地的能力,帶動數(shù)字經(jīng)濟(jì)發(fā)展。中國工程院院士沈昌祥也提到,自主可信計算是發(fā)展數(shù)字經(jīng)濟(jì)的前提,可以有效降低數(shù)智化安全風(fēng)險。完備的可信計算3.0產(chǎn)品鏈,將形成巨大的新型產(chǎn)業(yè)空間。
數(shù)據(jù)產(chǎn)業(yè)的溫州樣本
數(shù)據(jù)產(chǎn)業(yè)在溫州的發(fā)展,是一個值得研究和參照的樣本范例。
2022年,溫州數(shù)安港正式投用。在不到三年的時間里,已經(jīng)集聚了超600家的生態(tài)企業(yè),其中包括中國電子、美樂互動等一大批龍頭企業(yè),歸集公共數(shù)據(jù)840多億條,落地12個國家級的財政類的數(shù)據(jù)實(shí)驗(yàn)室,開發(fā)數(shù)據(jù)產(chǎn)品達(dá)到了460多個,2024年數(shù)據(jù)交易額超過了50億元。
依靠這樣的成績單,溫州數(shù)安港成功入選國家數(shù)據(jù)要素綜合試驗(yàn)區(qū)示范園區(qū)試點(diǎn),溫州也成為全國唯一承擔(dān)六項國家級數(shù)據(jù)基礎(chǔ)設(shè)施試點(diǎn)大滿貫的城市。
溫州的腳步,走在了國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的陣前排頭。
今年1月,國家發(fā)展改革委、國家數(shù)據(jù)局、工業(yè)和信息化部聯(lián)合印發(fā)的《國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)指引》提出三階段目標(biāo):到2026年,開展數(shù)據(jù)基礎(chǔ)設(shè)施技術(shù)路線試點(diǎn)試驗(yàn),支持部分地方、行業(yè)、領(lǐng)域先行先試;到2028年,建成支撐數(shù)據(jù)規(guī)模化流通、互聯(lián)互通的數(shù)據(jù)基礎(chǔ)設(shè)施,實(shí)現(xiàn)全國大中型城市的基本覆蓋;到2029年,基本建成國家數(shù)據(jù)基礎(chǔ)設(shè)施主體結(jié)構(gòu),初步形成橫向聯(lián)通、縱向貫通、協(xié)調(diào)有力的國家數(shù)據(jù)基礎(chǔ)設(shè)施基本格局,國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)和運(yùn)營體制機(jī)制基本建立。
據(jù)介紹,目前溫州正在發(fā)力搶占“人工智能+數(shù)據(jù)安全”賽道,嘗試打造全國首個以AI數(shù)據(jù)安全為核心的創(chuàng)新平臺。
一方面,溫州已經(jīng)落地了一批央企和行業(yè)頭部的數(shù)據(jù)端口,足以形成大量沉淀的開源數(shù)據(jù);另一方面,溫州正在建設(shè)綠化零碳十萬卡級的智算中心,構(gòu)建東南沿海算力協(xié)同網(wǎng)絡(luò)。從數(shù)據(jù)和算力兩個維度,為AI訓(xùn)練和大模型應(yīng)用提供基礎(chǔ)設(shè)施保障。
此外,在公共數(shù)據(jù)運(yùn)營和場景落地方面,溫州以自身為節(jié)點(diǎn),正在跟全國的城市進(jìn)行溝通和對接,在醫(yī)療、交通、科技等各類民生治理發(fā)展領(lǐng)域,攜手聯(lián)盟城市實(shí)現(xiàn)數(shù)據(jù)交易和場景應(yīng)用等一套標(biāo)準(zhǔn),形成百城共通共享的標(biāo)桿性AI應(yīng)用場景。
2025數(shù)據(jù)安全發(fā)展大會現(xiàn)場,溫州市、重慶市、武漢市、西安市、寧波市、青島市等25家城市代表共同簽訂數(shù)據(jù)要素合作“百城行動”城市聯(lián)盟;30多家數(shù)據(jù)企業(yè)集中簽約,共同建設(shè)數(shù)據(jù)要素產(chǎn)業(yè)新生態(tài)。
目前,溫州正在謀劃建設(shè)DeepSeek開發(fā)商等專業(yè)的園區(qū),目標(biāo)是全面形成“數(shù)據(jù)匯溫州、企業(yè)聚溫州、場景落溫州”的磁場效應(yīng),繼續(xù)沖擊數(shù)字經(jīng)濟(jì)的新高地。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.