來源 | 智合標準化建設
作者 | 智合標準中心
數據是AI的“原油”。數據標注作為訓練大模型至關重要的一環,直接影響機器學習模型的性能。高質量的數據標注,將有助于機器精準理解、快速學習、高效訓練,顯著提升大模型的準確性和泛化能力。
從政策層面看,今年年初,國家發展改革委等部門聯合發布《關于促進數據標注產業高質量發展的實施意見》,同時國家數據局表示,未來將進一步暢通數據采集、標注、人工智能應用產業鏈,這均標志著國家在大力推進數據標注產業發展。
圖1. 來源于數據驅動智能
然而,隨著高質量發展的不斷深化,產業長期存在的數據來源模糊、標注質量失控、隱私泄露、敏感信息不當處理等合規問題日漸突出。當技術創新與合規風險形成對沖,行業亟需一套低成本、可復制的解決方案。未來隨著監管趨嚴,相關企業在數據標注層面的合規能力,或成其核心競爭力。
為提升數據標注行業規范化發展,由中國電子商會歸口管理,智合標準中心正式啟動了《面向人工智能的數據標注合規指南》團體標準的研制工作,目前初稿已經出爐。
現持續邀請人工智能廠商、數據標注企業、合規專業服務機構、技術方案提供商、以及開展人工智能研究的高校或科研院所等加入標準起草編制組,結合業務實踐建言獻策,共探數據標注產業高質量發展的合規路徑。
【已確認參與起草的部分單位】
中移互聯網有限公司
公安部第三研究所
中國電子信息產業發展研究院(賽迪研究院)
江蘇鐘吾大數據發展集團有限公司
北京云測數據科技有限公司
福建中銳電子科技有限公司
螞蟻科技集團股份有限公司
北京集納盛廣網絡科技有限公司(37度數據)
北京易華錄信息技術股份有限公司
北京熱熱文化科技有限公司(熱熱數據)
杭州數據交易所有限公司
澳鵬Appen
國網江蘇省電力有限公司連云港供電分公司
廣西影迅物流有限公司
金華途樣網絡科技有限公司
重慶群星引力大數據科技有限公司
西藏云通數字科技有限公司
北京之合網絡科技有限公司
上海之合網絡科技有限公司
北京市環球律師事務所
廣東廣悅律師事務所
浙江浦源律師事務所
更多單位確認中......
《標準》結合“業務場景實操化、人員管理規范化、企業經營穩健化”3大原則,聚焦數據來源、標注內容與過程操作、標注人員管理、數據安全與隱私保護、監督和審計機制5大關鍵合規議題展開研制,將幫助AI企業從源頭低成本解決數據標注合規難題。
歡迎人工智能企業,數據標注技術廠商,數據標注平臺運營方,數據安全技術廠商、法律合規服務機構,以及開展人工智能研究的高校或科研院所等相關單位參與起草工作,與會共研、共議標準優化方向。
如您對本標準感興趣,歡迎掃碼填報信息,后續會有工作人員與您聯系。
【編制計劃】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.