字節和百度打官司,百度贏了!
抖音抓取百度百科詞條
被判賠償800萬
5月21日,百度百科官方公眾號轉發了《海淀法院審結全國首例涉百科詞條數據競爭案》一文。
稱某公司未經許可,大量抓取其平臺60余萬條百科詞條數據,嚴重削弱了原告的競爭優勢。
同時,被告偽造用戶信息,以普通用戶發布的形式,將抓取的詞條內容上傳至運營的百科網站中,向自身用戶進行展示和提供服務,涉及范圍廣,足以產生部分實質性替代的效果。
經海淀法院審理,其行為構成了不正當競爭,判決被告刪除涉案詞條,并賠償原告經濟損失500萬元及合理開支300萬元(含律師費、公證費等)。
5月23日,九派財經記者從知情人士獲悉,該案件訴訟雙方分別為百度百科和抖音百科,原告為百度,被告為抖音。
字節、百度拉扯戰
首次明確平臺數據整合權益
企查查顯示,早在2020年,字節收購互動百科,并將其更名為抖音百科后不久,百度就曾以“不正當競爭”為由起訴抖音百科,但隨后撤訴。
此外,字節與百度之間以“不正當競爭”為由產生的糾紛頗多。
2019年百度稱今日頭條大量竊取百度“Top1”搜索產品結果,以不正當競爭為由要求賠償9000萬元,并連續30天在其APP及網站首頁道歉。當天,抖音就反訴指控百度在“簡單搜索”APP中竊取了海量抖音短視頻,以同樣的賠償要求百度。
據統計,從2019年至2024年,雙方圍繞流量劫持、內容侵權等已發生27起案件,小到賠償40元。
此次案件是雙方以“不正當競爭”為由,賠償最大的一次,也是雙方長達6年訴訟的重要節點。
百度百科自2006年上線以來,至今收錄了超2860萬個詞條,參與詞條編輯的網友超過795萬人,覆蓋科學、文化、歷史、科技等幾乎所有已知知識領域,是全球規模最大的中文百科全書之一。
網友編輯的詞條版權到底歸誰所有?平臺擁有對詞條的合法權益嗎?
抖音百科抗辯稱:百度百科詞條內容由用戶生成,平臺不享有獨立權益。
而法院首次明確,百科平臺對詞條的系統化運營,如收集、存儲、編排、管理、傳播等,形成了獨立于用戶的“競爭性權益”,這種權益并非基于版權,即使詞條內容本身公開,未經授權的系統性搬運仍構成不正當競爭。
此案的核心意義不僅在于賠償金額巨大,更是確立了“平臺數據整合權益”的法律地位,為互聯網行業的數據合規劃定了清晰邊界。
AI數據合規性
這也為AI企業敲響了警鐘。
數據是大模型的重要訓練資源,而數據來源的合法性直接決定了技術應用的合規性。
未來,未經授權的系統性數據搬運可能會面臨法律重罰。即使數據公開,若AI應用直接分流原平臺用戶或替代其核心功能,仍可能構成侵權。
AI企業需與數據來源方簽署數據使用協議,明確數據用途和范圍,并且保留數據來源的授權協議、版權聲明等法律文件。
同時,企業還應通過技術手段驗證數據來源,比如百度文心大模型通過“內容溯源鏈”技術,對訓練數據的采集時間、地點、授權狀態進行實時標記,確保數據流向可追溯。
這種技術與法律的雙重保障,為數據合規提供了“雙保險”。
優質內容、海量數據已經成為AI時代兵家必爭之地,AI企業需建構數據溯源管理、合理使用把控、全流程合規體系,探索更加合法合規獲取數據方式。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.