沒有規則可言,AI野蠻掠奪,互聯網進入了至暗時代!剛發現我發表的原創內容被 DEEPSEEK、豆包、文心一言等 AI 聊天機器人白嫖了。
剛剛我用AI聊天機器人搜了一下我的名字,沒想到我的個人信息全部泄露了。AI聊天機器人參考了7條網頁信息源,其中第1條就是我個人網站的內容,然后就把息全部給扒出來了,對此我深表不安。未經我網站書面許可,AI竟然自動檢索我網站內容,這不是白嫖嗎?有什么辦法能夠防止AI檢索我網站的原創內容嗎?
在互聯網初期,像Google、Bing這些搜索引擎巨頭都不敢隨意索引別人的網站,那時候搜索引擎和網站達成了一個君子協定,這個君子協定就是robots.txt,robots.txt是搜索引擎爬蟲協議,也就是你的網站和爬蟲之間約定俗稱的一個協議,雖然不是強制性的,但雙方意念合一。
比如我網站的robots.txt(詳見https://www.cad2d3d.com/robots.txt)內容如下:
User-agent: *
Disallow: /phpMyAdmin/
Disallow: /beautiful-life/
Disallow: /user/
其中,User-agen t代表搜索引擎,* 代表所有,當然我也可以針對某個搜索引擎單獨制定規則,比如針對百度搜索引擎,可以寫成 User-agent: baiduspider。
Disallow是不允許訪問的意思,可以指定哪些文件夾不允許搜索引擎訪問。
AI聊天機器人本質是搜索引擎2.0,可惜到了AI時代,互聯網竟然退回到原始的叢林社會,內容剽竊習以為常,野蠻掠奪成為了常態,各大廠商毫無忌憚,肆意掠奪我們的原創內容,白嫖我們的勞動成果,然后它們自己賺的盆滿缽滿。
如何才能防止AI白嫖我們的原創內容?在原始野蠻的AI時代,我們好像無能為力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.