濁浪滔滔。
一
《黑神話:悟空》上線之后,各大資訊平臺出現一批奇怪文章。
它們開篇講“震驚”,全文說“震撼”,然而沒評測、沒細節、沒結論,如大圣爺毫毛化猴,面目雷同又空空如也,最后匯入百億流量之中。
類似場景已成常態。全紅嬋跳水時,它們齊喊“真牛啊真厲害”,樊振東逆襲時,它們齊嘆“如流星劃過巴黎夜空”。
陳若琳騎電動車接全紅嬋,它們寫了一千多字廢話,探討“如何樹立正確的價值觀和行為準則”。
幾天前,異形新電影上映,它們這樣寫道:
《異形奪命艦》猶如一艘穿越星際的票房巨輪,在暑期檔的浩瀚影海中破浪前行。
它們辭藻華麗,但言之無物;它們會用修辭,但馬嘴驢唇;它們善用固定套路,但從無中心思想。
它們由AI大模型晝夜產出,鋪滿我們的世界。
紙媒時代,如此文章絕無可能上版;論壇時代,通篇廢話自然會沉。然而當下,在碎片和流量洗刷中,在算法和AI合謀下,污染開始了。
最開始只是洗稿,工作室輾轉用上GPT,模仿文風,抄襲脈絡,替換詞匯,但終究還需人工編輯。
后來擴寫流行,幾句話的新聞,可填充廢話,變成千字文章。國內大模型普及后,更勢不可擋。
文心擅寫百家號,豆包能寫頭條號,元寶更懂公眾號,工具無疆,用者無畏。
堆砌而出的AI文章,最后要靠標題引流,標題也是AI起的,批量爆款標題,任君選擇。
小紅書上AI文章總結AI寫作:只要會電腦,一天生產一百條爆款!
6年前,做號團隊尚叫“內容農場”,有工作室設在山東北部農村,農婦運指如飛,日產文章10篇以上。
她們有著流水線套路:明星動態開頭,填充背景資料,最后加幾段口水看法,標題要亮眼,行文要簡單。
最后,還有人開發出“一鍵偽原創”洗稿軟件,躲避平臺查重。
然而當年,做號團隊的應屆生,并不看好低質內容未來,“以后肯定會越來越少。”
他錯了。6年后,低質內容正在泛濫,做號不用蝸居山村,寫稿不再雇傭農婦,AI發文已沒有了門檻。
滑動中,文章列表從魚蛇混雜變為滿屏荒唐。冗長文字中,信息量需自行發掘。
戰場動態不知戰果,兇案報道沒有兇手,觀影評論沒有觀感,有文章評測三款手機,羅列一番后寫道:
這三款手機雖然各有特色,但也都不乏爭議。或許,我們應該從一個更宏觀的角度來審視它們。
今年1月,網傳西安有巨大爆炸聲,警方最終查出謠言來自江西南昌一家MCN,他們用AI日產7000篇內容,真假難辨。
清華大學新聞學院報告稱,近一年來,經濟與企業類AI謠言,增速高達99.91%。
海外同理,美國調查機構“新聞守衛”稱,生成虛假文章的網站數量自2023年5月以來,激增了1000%以上,涉及15種語言。
如果說,當年算法推薦下,信息如繭房,那么當下,信息已成濁浪。
很多年前的夏天,清瘦的語文老師在黑板上寫下,“蓬生麻中,不扶而直;白沙在涅,與之俱黑”。環境會改變一切。
那么被濁浪沖刷的我們,會改變什么?
二
AI污染的不只資訊。
知乎邀請回答列表中,大量回答都充斥AI味道。從羅馬歷史、音箱推薦到量子物理,AI無所不答。
機器生成的答案,保留著出廠特征:內容空洞、行文生硬、思維跳躍,最后愛加“綜上所述”。
同樣AI味也彌漫小紅書。深夜的美女、賣萌的貓咪、不可發朋友圈的細糠,都可能是AI生成。
有男生見海邊泳裝少女,心生愛慕,私信未果后,放大圖片,發現照片女子有多根手指。
經驗貼里,有人傳授“40歲的女人”起號方法:找到對標賬號,下載別人照片,用AI圖生圖,一個虛構女人便誕生了。
虛構的40歲女人,用AI文案表達著歲月靜好,靈活用著表情符號,并能帶貨保健品。
AI角色也活躍在評論區。微博上,AI機器人四處尬聊回復,有用戶抱怨,拉黑都拉不過來。
他曾回復頭像是孫悟空的AI,“有什么方法把你們這些AI都屏蔽掉嗎?”
AI給了一個最具人味的回答:哈哈,你屏蔽不了俺老孫!
百度貼吧有個相似產品叫“貼吧包打聽”,一年多發帖42.4萬,吧友不堪其擾:
幾乎每個游戲求助帖里,都有包打聽身影。但如果仔細瀏覽包打聽的言論,那么會發現它寫的玩意99%都是胡編的。
有人發帖詢問“如何關閉貼吧包打聽”,包打聽沖進來回答“建議在百度貼吧發帖詢問如何關閉貼吧包打聽”。無限套娃。
許多事情都在污染中丟失本來面目。
商品好評是AI,飯店長評是AI,AI已編織迷宮,舉目難辨。
迷宮的磚石并不只是文字。
短視頻平臺上,“做人要有城府”的俄羅斯美女,“人生八個真相”的雞湯導師,“不生孩子如何養老”的中年阿姨,都是假的。
形象是AI克隆的,聲音是AI模擬的,文稿是爆款洗稿后,批量生成的。
視頻質量差,但勝在海量,鋪天蓋地。
最后,連網文也開始淪陷。
今年7月,有小說平臺上,出現多個疑似AI作者,ID“江沅說書”,近3個月內上架266本小說,更新速度遠超人類。
小說開頭基本雷同,多為“熙熙攘攘的街道,陽光如何如何”。
去年夏天,美國多家媒體報道“AI圖書正在淹沒亞馬遜”。亞馬遜“青少年浪漫”銷排行榜前100本電子書中,八成語無倫次,疑似AI。
有人讀一本AI寫野生蘑菇的電子書,里面寫識別蘑菇要靠味道,紐約真菌學會嚇得出面呼吁:
“請只購買已知作者和美食家的書籍,這可能關系到生死”。
濁浪正遍布各個領域,我們看的新聞,看的書,刷的視頻,讀的回貼,查的評價,甚至交的網友,都涂抹著AI油彩。
這是當下的浮世繪,真偽不知,哭笑不得。
三
污染最后殃及AI自身。AI正用自己生產的垃圾,訓練自己。
今年5月,谷歌推出AI概述,宣稱不用再看網頁,AI匯總,直接給出答案。
然而,AI告訴網友們:
人一天至少要吃一小塊石頭,披薩要加膠水防止奶酪掉,一只狗曾經打過NBA,奧巴馬大學畢業了21次。
那些答案匯總自很多年前的帖子,AI不懂人類的幽默,最后調侃變成了答案。
比抓取舊貼更可怕是抓取AI結果。
國內曾有大模型,生成2000萬條AI內容,被谷歌抓取。
結果啼笑皆非。在AI理解中,中國男足曾奪世界杯,因為有詳細全程;福建人懼怕廣東人,因為自身安全。
微軟必應上搜索《肖生克救贖》主角,AI一本正經說:男的叫小帥,配角叫老黑,女主通通叫小美。
它抓取的是AI生產的3分鐘介紹電影腳本。
搜索引擎的荒唐只是表象,更大危機來自大模型訓練。
美國教授安德森計算,人類投喂大模型的高質量閱讀材料,將在2027年耗盡。
事實上,人工內容已跟不上AI訓練胃口,當下,許多大模型已用AI訓練AI。
然而,深度學習之父辛頓稱,如果AI的訓練數據是垃圾,那么它輸出的也將是垃圾。
論文顯示,2023年6月GPT-4任務表現急速下滑,500道高數題目,3月份答對488個,6月只對12個。
工程師發現,用AI訓練AI,模型會出現不可逆的缺陷,最終陷入瓶頸,只能輸出垃圾,研究人員做了一個比喻:
就像用塑料垃圾散布海洋、用二氧化碳攻占大氣,我們即將用廢話填滿互聯網。
趨勢已經出現。馬斯克吐槽說,AI生成信息已污染互聯網,“2023年AI普及前的搜索結果,相比來說會更靠譜。”
ChatGPT的數據源截至2021年9月,在那之前的互聯網,可能是我們最后的凈土。
而眼下,一個黑色螺旋正在運行:因為AI污染,原創減少,而原創減少后,AI缺乏訓練,自噬自身,只能繼續生產低質垃圾。
長久以來,我們一直忽略了另外一種可能。
我們以為AI帶來的未來,嶄新高效,雖然有失業沖擊,但世界進化。
然而,或許還有一種可能,一切沒有變好,我們面臨的是垃圾圍城。
1859年4月,倫敦灰霧中,路人展開雜志,狄更斯《雙城記》第一句映入眼簾:
這是一個最好的時代,
也是一個最壞的時代;
這是智慧的時代,
這是愚昧的時代。
這是被引用過無數次的句子,但AI不知道,用在這里最合適。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.