來源:高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟
2025年3月31日下午,國新辦舉行新聞發(fā)布會。國家發(fā)展改革委黨組成員、國家數(shù)據(jù)局局長劉烈宏在回答記者提問時表示,人工智能+行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。
劉烈宏談到,2025年政府工作報告指出,要持續(xù)推進(jìn)“人工智能+”行動,將數(shù)字技術(shù)與制造優(yōu)勢、市場優(yōu)勢更好結(jié)合起來,支持大模型廣泛應(yīng)用。應(yīng)該說,算法、算力、數(shù)據(jù)是人工智能發(fā)展的三個基本要素。這三者相互獨(dú)立又深度協(xié)同,共同按照規(guī)模定律(Scaling Law)推動人工智能的迭代創(chuàng)新發(fā)展。人工智能的發(fā)展離不開數(shù)據(jù)資源的開發(fā)利用。高質(zhì)量數(shù)據(jù)作為人工智能應(yīng)用的底座,不僅對通用大模型具有很強(qiáng)的保障支撐作用,對行業(yè)大模型更加重要。中國在人工智能領(lǐng)域取得的成果與數(shù)據(jù)工作的創(chuàng)新實(shí)踐密不可分。同時,分享了國家數(shù)據(jù)局下一步工作計劃。
首先,持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)。
算力是人工智能發(fā)展的基石。國際上有人說,人工智能的盡頭是算力,算力的盡頭是電力。在中國,電力是我們的優(yōu)勢,我們要充分利用好西部的綠電資源。過去一年,我們會同國家發(fā)展改革委、工業(yè)和信息化部、國家能源局等有關(guān)部門,大力實(shí)施“東數(shù)西算”工程,加快推進(jìn)全國一體化算力網(wǎng)建設(shè),協(xié)調(diào)推進(jìn)算力建設(shè)與能源設(shè)施協(xié)同布局。今年底,我們要實(shí)現(xiàn)60%以上新增算力在國家樞紐節(jié)點(diǎn)集聚,新建大型數(shù)據(jù)中心使用綠電占比超過80%。
其次,持續(xù)推進(jìn)高質(zhì)量數(shù)據(jù)供給。
高質(zhì)量的數(shù)據(jù)供給是人工智能發(fā)展的不竭動力。人工智能時代,Token作為模型處理文本的最小單元,通常是指一個單詞或者單詞的一部分、字符或者其他有意義的文本片段,已經(jīng)成為一個新的衡量標(biāo)準(zhǔn)。據(jù)有關(guān)機(jī)構(gòu)研究表明,2024年初,中國日均Token消耗量為1千億,現(xiàn)在每日消耗量已經(jīng)達(dá)到10萬億級,1年增長100倍。行業(yè)應(yīng)用和典型場景的落地,是推動人工智能進(jìn)化普及的關(guān)鍵一環(huán)。基于我國海量數(shù)據(jù)資源和豐富應(yīng)用場景的優(yōu)勢,我們將加快推動數(shù)據(jù)要素和人工智能產(chǎn)業(yè)賦能、終端應(yīng)用和場景培育相結(jié)合。積極引導(dǎo)做好高質(zhì)量數(shù)據(jù)集建設(shè)工作,“人工智能+”行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。進(jìn)一步推動數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展,為人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用提供堅實(shí)的數(shù)據(jù)基礎(chǔ)。
最后,持續(xù)推進(jìn)數(shù)據(jù)流通交易。
數(shù)據(jù)要素市場化配置改革和“人工智能+”行動是同向發(fā)力、同頻共振的。當(dāng)前,全國數(shù)據(jù)系統(tǒng)正在加快建設(shè)高質(zhì)量數(shù)據(jù)集,高質(zhì)量數(shù)據(jù)集也已經(jīng)開始在數(shù)據(jù)交易所掛牌交易。剛才我們說到,據(jù)有關(guān)研究表明,2024年,中國數(shù)據(jù)生產(chǎn)量同比增長20%,數(shù)據(jù)流通交易量同比增長超過30%。我們將逐步完善數(shù)據(jù)市場規(guī)范,構(gòu)建數(shù)據(jù)流通交易標(biāo)準(zhǔn)體系,細(xì)化流通交易規(guī)則,推動發(fā)布數(shù)據(jù)流通交易標(biāo)準(zhǔn)示范合同,降低數(shù)據(jù)流通交易制度性成本,提升數(shù)據(jù)流通交易效率,更好地助力“人工智能+”行動。
分析認(rèn)為,劉烈宏提出“人工智能+行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里”,這一表述體現(xiàn)了中國在推動人工智能(AI)發(fā)展過程中對數(shù)據(jù)基礎(chǔ)能力的戰(zhàn)略性重視。其核心邏輯和背景可以從以下幾個方面分析:
一、數(shù)據(jù)是AI發(fā)展的核心生產(chǎn)資料
AI技術(shù)的訓(xùn)練、迭代和應(yīng)用高度依賴高質(zhì)量數(shù)據(jù)。無論是大模型的深度學(xué)習(xí),還是垂直領(lǐng)域的具體應(yīng)用(如醫(yī)療影像識別、自動駕駛、智能制造等),都需要大規(guī)模、結(jié)構(gòu)化、標(biāo)注清晰的數(shù)據(jù)集作為支撐。劉烈宏的提法強(qiáng)調(diào)了數(shù)據(jù)供給與AI應(yīng)用場景的同步配套,避免因數(shù)據(jù)短缺或質(zhì)量不足制約技術(shù)落地。
案例:醫(yī)療AI需要大量病例數(shù)據(jù)訓(xùn)練模型,但若數(shù)據(jù)分散、標(biāo)準(zhǔn)不一或存在隱私問題,技術(shù)研發(fā)和商業(yè)化就會受阻。因此,建設(shè)高質(zhì)量醫(yī)療數(shù)據(jù)集是AI醫(yī)療應(yīng)用的前提。
二、推動“人工智能+”與產(chǎn)業(yè)深度融合
“人工智能+”是中國推動AI賦能實(shí)體經(jīng)濟(jì)的重要戰(zhàn)略(類似“互聯(lián)網(wǎng)+”模式)。不同行業(yè)對數(shù)據(jù)的需求差異極大:
工業(yè)領(lǐng)域:需要設(shè)備傳感器數(shù)據(jù)、生產(chǎn)流程數(shù)據(jù);
交通領(lǐng)域:依賴實(shí)時路況、車輛行為數(shù)據(jù);
金融領(lǐng)域:需合規(guī)的征信、交易數(shù)據(jù)等。
劉烈宏的提法強(qiáng)調(diào)“場景導(dǎo)向”,即針對特定行業(yè)需求,定向建設(shè)和推廣數(shù)據(jù)集,避免“一刀切”的數(shù)據(jù)供給模式,從而更高效地推動AI技術(shù)落地。
三、解決數(shù)據(jù)質(zhì)量與流通痛點(diǎn)
當(dāng)前中國數(shù)據(jù)資源存在“量大但質(zhì)低”的問題:(一)數(shù)據(jù)孤島:部門、企業(yè)間數(shù)據(jù)割裂,難以共享;(二)標(biāo)注粗糙:許多數(shù)據(jù)缺乏標(biāo)準(zhǔn)化標(biāo)注,影響AI訓(xùn)練效果;(三)合規(guī)風(fēng)險:數(shù)據(jù)采集和使用涉及隱私、安全等問題。通過主動規(guī)劃和建設(shè)高質(zhì)量數(shù)據(jù)集,可以建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和共享機(jī)制;提升數(shù)據(jù)標(biāo)注的專業(yè)性(如通過第三方標(biāo)注平臺);確保數(shù)據(jù)合規(guī)流通(如匿名化處理、授權(quán)機(jī)制)。
四、構(gòu)建健康的AI產(chǎn)業(yè)生態(tài)。
高質(zhì)量數(shù)據(jù)集的推廣有助于:(一)降低中小企業(yè)門檻:中小企業(yè)和科研機(jī)構(gòu)通常難以自建數(shù)據(jù)集,公共數(shù)據(jù)集的開放可減少其研發(fā)成本;(二)防止數(shù)據(jù)壟斷:避免少數(shù)大企業(yè)通過數(shù)據(jù)壁壘形成市場壟斷;(三)促進(jìn)技術(shù)創(chuàng)新:開放數(shù)據(jù)集可激發(fā)算法優(yōu)化、模型輕量化等衍生技術(shù)研發(fā)。
五、 應(yīng)對國際競爭與技術(shù)自主可控
全球AI競爭不僅是算法和算力的比拼,更是數(shù)據(jù)資源的爭奪。中國需要通過高質(zhì)量數(shù)據(jù)集的規(guī)模化建設(shè):(一)減少對境外數(shù)據(jù)源的依賴(如某些開源數(shù)據(jù)集);
(二)提升國產(chǎn)AI模型在中文語境、本土場景下的競爭力;(三)通過數(shù)據(jù)主權(quán)保障國家安全(例如地理信息、生物特征等敏感數(shù)據(jù))。
六、政策層面的配套布局
劉烈宏的提法與中國近年數(shù)據(jù)要素市場化改革一脈相承,呼應(yīng)了以下政策方向:(一)“數(shù)據(jù)要素×”行動計劃:推動數(shù)據(jù)在重點(diǎn)行業(yè)的規(guī)模化應(yīng)用;(二)“東數(shù)西算”工程:優(yōu)化算力與數(shù)據(jù)資源的地理分布;(三)數(shù)據(jù)安全法規(guī)(如《數(shù)據(jù)安全法》《個人信息保護(hù)法》):為數(shù)據(jù)流通劃定合規(guī)邊界。
因此,劉烈宏的倡議本質(zhì)上是將數(shù)據(jù)視為AI時代的“新基建”,強(qiáng)調(diào)數(shù)據(jù)資源需與AI應(yīng)用場景同步規(guī)劃、動態(tài)適配。這一思路既符合技術(shù)發(fā)展規(guī)律,也服務(wù)于國家戰(zhàn)略目標(biāo)——通過夯實(shí)數(shù)據(jù)基礎(chǔ),加速AI技術(shù)向生產(chǎn)力轉(zhuǎn)化,同時確保中國在全球數(shù)字化競爭中的主動權(quán)。
全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟
全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟(簡稱:高校聯(lián)盟)是由清華大學(xué)、浙江大學(xué)、中南大學(xué)、東北大學(xué)、上海工程技術(shù)大學(xué)、重慶郵電大學(xué)、東北林業(yè)大學(xué)、佛山科學(xué)技術(shù)學(xué)院、曲阜師范大學(xué)、黑龍江大學(xué)、海豚大數(shù)據(jù)科技等全國54家高校、企業(yè)共同發(fā)起,于2018年5月26日在北京中國科技會堂正式成立。迄今為止,聯(lián)盟發(fā)展會員300多家, 覆蓋全國20多個省市。聯(lián)盟由一批積極投身于“人工智能、大數(shù)據(jù)、區(qū)塊鏈”教育事業(yè)的高校、科研機(jī)構(gòu)、企事業(yè)單位和個人自愿組成的公益性、全國性學(xué)術(shù)交流服務(wù)平臺。中國工程院原常務(wù)副院長、中國工程院院士潘云鶴、中國科學(xué)院院士陳國良、中國工程院院士李伯虎擔(dān)任聯(lián)盟名譽(yù)理事長,中國工程院院士譚建榮擔(dān)任聯(lián)盟理事長。聯(lián)盟工作接受工信部、國家網(wǎng)信辦等政府部門行政管理和業(yè)務(wù)指導(dǎo)。聯(lián)盟主要工作是推進(jìn)產(chǎn)教融合、校企合作、協(xié)同育人。(加盟微信13651193492)
華算人工智能研究院
華算人工智能研究院全稱是“山西省華算人工智能研究院有限公司”,是經(jīng)山西轉(zhuǎn)型綜合改革示范區(qū)管理委員會批準(zhǔn),于2023年10月在太原成立的第一批專業(yè)研究人工智能、賦能數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展的獨(dú)立法人組織。華算人工智能研究院依托全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟專家委員會及理事會資源,按照山西省委省政府、山西轉(zhuǎn)型綜合改革示范區(qū)管理委員會發(fā)展人工智能、數(shù)字經(jīng)濟(jì)的系列文件精神和工作計劃,將研究院打造成為山西省發(fā)展人工智能、數(shù)字經(jīng)濟(jì)的示范應(yīng)用推廣平臺,同時面向全國開展人工智能業(yè)務(wù)。華算人工智能研究院名譽(yù)院長由中國工程院院士李伯虎擔(dān)任。研究院內(nèi)設(shè)AI產(chǎn)業(yè)學(xué)院共建中心、實(shí)訓(xùn)實(shí)習(xí)就業(yè)中心、實(shí)驗(yàn)室建設(shè)中心、專家智庫等6個職能部門。歡迎加入華算人工智能研究院專家智庫,共同賦能高校AI人才培養(yǎng)及產(chǎn)教融合事業(yè)發(fā)展。
高校區(qū)塊鏈專委會
全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟區(qū)塊鏈專委會(簡稱:高校區(qū)塊鏈專委會),是由北京大學(xué)、浙江大學(xué)、武漢大學(xué)、西南財經(jīng)大學(xué)、北京交通大學(xué)、鄭州大學(xué)、貴州大學(xué)、桂林電子科技大學(xué)、山西農(nóng)業(yè)大學(xué)、佛山科學(xué)技術(shù)學(xué)院、陜西師范大學(xué)、中國網(wǎng)安、海豚大數(shù)據(jù)科技等全國40多家高校、企業(yè)和機(jī)構(gòu)共同發(fā)起,于2019年12月7日在廣東省佛山市正式成立。目前發(fā)展高校及企業(yè)會員70多家。中國工程院院士、浙江大學(xué)教授陳純擔(dān)任高校區(qū)塊鏈專委會名譽(yù)顧問;福州大學(xué)教授蔡維德、中國計算機(jī)學(xué)會區(qū)塊鏈專委會主任斯雪明教授、中國人民銀行數(shù)字貨幣研究所副所長狄剛擔(dān)任高校區(qū)塊鏈專委會名譽(yù)主任;北京大學(xué)信息科學(xué)技術(shù)學(xué)院區(qū)塊鏈中心主任陳鐘教授擔(dān)任高校區(qū)塊鏈專委會主任。高校區(qū)塊鏈專委會主要工作是促進(jìn)高校區(qū)塊鏈教育,為高校區(qū)塊鏈專業(yè)建設(shè)及學(xué)科發(fā)展提供專家咨詢服務(wù)。
高校元宇宙專委會
全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟元宇宙專業(yè)委員會(簡稱:高校元宇宙專委會),是由清華大學(xué)、湖南大學(xué)、浙江大學(xué)、四川大學(xué)、汕頭大學(xué)、河北金融學(xué)院、保定市元宇宙協(xié)會、英偉達(dá)中國、海爾衣聯(lián)網(wǎng)研究院、海豚大數(shù)據(jù)科技(天津)有限公司等全國20多所高校、企業(yè)和機(jī)構(gòu)共同發(fā)起,于2022年11月5日在北京正式成立。中國工程院院士、計算機(jī)軟件與虛擬現(xiàn)實(shí)領(lǐng)域?qū)<亿w沁平擔(dān)任高校元宇宙專委會名譽(yù)顧問;中國工程院院士、北京航空航天大學(xué)電氣與自動化學(xué)院名譽(yù)院長、中國航天科工集團(tuán)有限公司科技委高級顧問李伯虎擔(dān)任高校元宇宙專委會名譽(yù)主任;清華大學(xué)信息國研中心可信軟件和大數(shù)據(jù)部常務(wù)副主任邢春曉擔(dān)任高校元宇宙專委會主任委員。目前已發(fā)展高校及企業(yè)會員30多家。高校元宇宙專委會主要工作是促進(jìn)高校元宇宙教育、加強(qiáng)校企合作、推動元宇宙專業(yè)建設(shè)及學(xué)科發(fā)展,為元宇宙教育教學(xué)提供專家咨詢服務(wù)。
高校數(shù)字經(jīng)濟(jì)專委會
全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟數(shù)字經(jīng)濟(jì)專業(yè)委員會(簡稱:高校數(shù)字經(jīng)濟(jì)專委會),是由華算人工智能研究院、清華大學(xué)、北京大學(xué)、中國人民大學(xué)、中國社會科學(xué)院信息化研究中心、四川大學(xué)、北京外國語大學(xué)、北京科技大學(xué)、北京工業(yè)大學(xué)、北京語言大學(xué)、北京化工大學(xué)、北京聯(lián)合大學(xué)、北京物資學(xué)院、北京印刷學(xué)院、西藏民族大學(xué)、河北金融學(xué)院、重慶財經(jīng)學(xué)院、蘇州城市學(xué)院、北京中關(guān)村軟件園、百度、海豚大數(shù)據(jù)科技等全國60多家高校、企業(yè)和機(jī)構(gòu)共同發(fā)起,于2024年1月12日在北京正式成立。清華大學(xué)經(jīng)濟(jì)管理學(xué)院教授姜旭平、北京大學(xué)信息管理系教授賴茂生、中國社會科學(xué)院信息化研究中心主任姜奇平、中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院教授呂本富擔(dān)任高校數(shù)字經(jīng)濟(jì)專委會主任委員。高校數(shù)字經(jīng)濟(jì)專委會主要工作是促進(jìn)高校數(shù)字經(jīng)濟(jì)專業(yè)建設(shè)及學(xué)科發(fā)展,推動產(chǎn)學(xué)研合作,為高校數(shù)字經(jīng)濟(jì)專業(yè)教育教學(xué)提供專家咨詢服務(wù)。
聯(lián)盟“資料圖書館”
微信咨詢
說明:轉(zhuǎn)載文章和圖片均來自公開網(wǎng)絡(luò),推送文章除非無法確認(rèn),都會注明作者和來源,如有侵權(quán)請聯(lián)系刪除。
往期精彩文章(單擊就可查看):
. 辦
. 》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.