來源:高校人工智能與大數據創新聯盟
2025年4月9日至11日,中國電子首席科學家蔣國飛出席第十三屆中國電子信息博覽會(簡稱“電博會”)并發表主題演講,他系統闡述了數據如何驅動人工智能發展,強調在算力與模型能力逐步拉平的競爭格局下,高質量數據集已成為AI發展的核心驅動力,而數據基礎設施建設與數據處理技術創新是破解行業應用落地瓶頸的關鍵路徑。
分析認為,蔣國飛提出高質量數據集已成為人工智能發展的核心驅動力,這一觀點反映了當前AI技術發展的關鍵需求和趨勢。以下是這一主張的核心邏輯和背景分析:
一、高質量數據是AI模型的“燃料”
(一)基礎性作用:AI模型(尤其是深度學習)的性能高度依賴訓練數據的質量。數據質量包括多樣性、準確性、標注精度和覆蓋范圍,直接決定了模型的學習上限。
(二)“垃圾進,垃圾出”原則:即使算法先進,低質量數據(如噪聲大、偏差明顯、標注錯誤)會導致模型失效或產生誤導性結果。例如,醫療影像AI若使用標注錯誤的病例數據,可能誤診。
二、當前AI發展的瓶頸正在向數據端轉移
(一)算力與算法趨于成熟:隨著芯片技術(如GPU/TPU)和算法框架(如Transformer)的進步,算力與算法的瓶頸逐漸緩解,但數據質量不足成為新的制約因素。
(二)大模型時代的隱憂:大規模預訓練模型(如GPT-4)需要海量數據,但互聯網數據的低信噪比(含錯誤、偏見或虛假信息)可能放大模型缺陷,需通過高質量數據優化。
三、行業應用對數據質量提出更高要求
(一)垂直領域需求:在工業、醫療、金融等領域,AI落地需要高度專業化、場景化的數據。例如:自動駕駛需要精準標注的道路場景數據;醫療AI依賴合規、多模態的醫學影像和病例數據。
(二)合規與倫理挑戰:高質量數據需符合隱私保護(如GDPR)、倫理規范(如無偏見)和行業標準,這對數據采集、標注和治理提出了更高要求。
四、數據質量驅動技術創新的“飛輪效應”
(一)高質量數據促進算法迭代:例如,ImageNet數據集推動了計算機視覺的突破,但其成功離不開數據集的嚴格標注和多樣性。
(二)反哺數據生態建設:AI技術(如自動標注、數據增強)可提升數據生產效率,形成“數據優化→模型改進→數據再優化”的正向循環。
五、中國AI發展的特殊背景
(一)數據規模優勢與質量短板:中國擁有龐大的人口和應用場景,數據量豐富,但數據孤島、標注標準不統一、隱私保護不足等問題制約了數據價值釋放。
(二)國家戰略需求:在“十四五”規劃中,中國將AI作為核心技術攻關方向,高質量數據基礎設施是支撐AI產業化落地的關鍵。蔣國飛的觀點可能與此背景下的技術布局相關。
因此,蔣國飛強調高質量數據集的核心地位,實質上是指出AI發展已進入“數據驅動精細化”階段。未來的競爭不僅是算法和算力的比拼,更是數據治理能力的競爭,包括:構建跨行業、多模態的數據共享平臺;推動數據標注的標準化和自動化;解決數據安全、隱私與開放的平衡問題。蔣國飛這一提法與中國電子(CEC)在數字經濟基礎設施領域的戰略方向一致,旨在通過高質量數據生態建設,推動AI從實驗室研究向產業實際價值轉化。
蔣國飛,男,畢業于北京理工大學,先后獲得本科和博士學位,在美國達特茅斯學院完成博士后研究。 2004年6月,蔣國飛加入NEC美國研究院,歷任高級研究員、部門主管及副總裁。2017年,蔣國飛加入螞蟻集團,曾任螞蟻集團副總裁、螞蟻數科總裁。 2024年7月,蔣國飛加入中國電子信息產業集團,負責推動落實國家數據要素和人工智能戰略。
全國高校人工智能與大數據創新聯盟
全國高校人工智能與大數據創新聯盟(簡稱:高校聯盟)是由清華大學、浙江大學、中南大學、東北大學、上海工程技術大學、重慶郵電大學、東北林業大學、佛山科學技術學院、曲阜師范大學、黑龍江大學、海豚大數據科技等全國54家高校、企業共同發起,于2018年5月26日在北京中國科技會堂正式成立。迄今為止,聯盟發展會員300多家, 覆蓋全國20多個省市。聯盟由一批積極投身于“人工智能、大數據、區塊鏈”教育事業的高校、科研機構、企事業單位和個人自愿組成的公益性、全國性學術交流服務平臺。中國工程院原常務副院長、中國工程院院士潘云鶴、中國科學院院士陳國良、中國工程院院士李伯虎擔任聯盟名譽理事長,中國工程院院士譚建榮擔任聯盟理事長。聯盟工作接受工信部、國家網信辦等政府部門行政管理和業務指導。聯盟主要工作是推進產教融合、校企合作、協同育人。(加盟微信13651193492)
華算人工智能研究院
華算人工智能研究院全稱是“山西省華算人工智能研究院有限公司”,是經山西轉型綜合改革示范區管理委員會批準,于2023年10月在太原成立的第一批專業研究人工智能、賦能數字經濟產業發展的獨立法人組織。華算人工智能研究院依托全國高校人工智能與大數據創新聯盟專家委員會及理事會資源,按照山西省委省政府、山西轉型綜合改革示范區管理委員會發展人工智能、數字經濟的系列文件精神和工作計劃,將研究院打造成為山西省發展人工智能、數字經濟的示范應用推廣平臺,同時面向全國開展人工智能業務。華算人工智能研究院名譽院長由中國工程院院士李伯虎擔任。研究院內設AI產業學院共建中心、實訓實習就業中心、實驗室建設中心、專家智庫等6個職能部門。歡迎加入華算人工智能研究院專家智庫,共同賦能高校AI人才培養及產教融合事業發展。
高校區塊鏈專委會
全國高校人工智能與大數據創新聯盟區塊鏈專委會(簡稱:高校區塊鏈專委會),是由北京大學、浙江大學、武漢大學、西南財經大學、北京交通大學、鄭州大學、貴州大學、桂林電子科技大學、山西農業大學、佛山科學技術學院、陜西師范大學、中國網安、海豚大數據科技等全國40多家高校、企業和機構共同發起,于2019年12月7日在廣東省佛山市正式成立。目前發展高校及企業會員70多家。中國工程院院士、浙江大學教授陳純擔任高校區塊鏈專委會名譽顧問;福州大學教授蔡維德、中國計算機學會區塊鏈專委會主任斯雪明教授、中國人民銀行數字貨幣研究所副所長狄剛擔任高校區塊鏈專委會名譽主任;北京大學信息科學技術學院區塊鏈中心主任陳鐘教授擔任高校區塊鏈專委會主任。高校區塊鏈專委會主要工作是促進高校區塊鏈教育,為高校區塊鏈專業建設及學科發展提供專家咨詢服務。
高校元宇宙專委會
全國高校人工智能與大數據創新聯盟元宇宙專業委員會(簡稱:高校元宇宙專委會),是由清華大學、湖南大學、浙江大學、四川大學、汕頭大學、河北金融學院、保定市元宇宙協會、英偉達中國、海爾衣聯網研究院、海豚大數據科技(天津)有限公司等全國20多所高校、企業和機構共同發起,于2022年11月5日在北京正式成立。中國工程院院士、計算機軟件與虛擬現實領域專家趙沁平擔任高校元宇宙專委會名譽顧問;中國工程院院士、北京航空航天大學電氣與自動化學院名譽院長、中國航天科工集團有限公司科技委高級顧問李伯虎擔任高校元宇宙專委會名譽主任;清華大學信息國研中心可信軟件和大數據部常務副主任邢春曉擔任高校元宇宙專委會主任委員。目前已發展高校及企業會員30多家。高校元宇宙專委會主要工作是促進高校元宇宙教育、加強校企合作、推動元宇宙專業建設及學科發展,為元宇宙教育教學提供專家咨詢服務。
高校數字經濟專委會
全國高校人工智能與大數據創新聯盟數字經濟專業委員會(簡稱:高校數字經濟專委會),是由華算人工智能研究院、清華大學、北京大學、中國人民大學、中國社會科學院信息化研究中心、四川大學、北京外國語大學、北京科技大學、北京工業大學、北京語言大學、北京化工大學、北京聯合大學、北京物資學院、北京印刷學院、西藏民族大學、河北金融學院、重慶財經學院、蘇州城市學院、北京中關村軟件園、百度、海豚大數據科技等全國60多家高校、企業和機構共同發起,于2024年1月12日在北京正式成立。清華大學經濟管理學院教授姜旭平、北京大學信息管理系教授賴茂生、中國社會科學院信息化研究中心主任姜奇平、中國科學院大學經濟與管理學院教授呂本富擔任高校數字經濟專委會主任委員。高校數字經濟專委會主要工作是促進高校數字經濟專業建設及學科發展,推動產學研合作,為高校數字經濟專業教育教學提供專家咨詢服務。
聯盟“資料圖書館”
微信咨詢
說明:轉載文章和圖片均來自公開網絡,推送文章除非無法確認,都會注明作者和來源,如有侵權請聯系刪除。
往期精彩文章(單擊就可查看):
. 辦
. 》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.