99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI暫時生成不了魯迅和張愛玲,但別高興太早

0
分享至


AI與人類語料“大屠殺”。

文|陳梅希

編|園 長

“你看看篇文章,像不像是AI寫的?”

一個普通的工作日,我把一篇稿子發給編輯部的同事,隨后對此展開AI文風大討論。這篇稿子短短兩千字,卻出現了三個“有人認為”,外加三個“有網友認為”。由于正文內容有明顯的“端水”動作,即寫一段正面觀點,立刻跟一段反面觀點,我們甚至開始猜測起文本來自哪位AI。

給AI斷文風,聽起來是件很荒謬的事。我們無法得知準確答案,畢竟去找作者問這篇稿子用了哪個AI,實在有些冒昧了。更何況,這只是一種揣測,很有可能那些“疑似AI創作”的痕跡,本就來源于某位人類寫作者本人的文字習慣。

比起開篇那個問題的答案,我們更焦慮的是這種懷疑本身——隨著AI生成的內容越來越多,人類逐漸意識到,自己無法準確判斷眼前的文字來自一雙手還是一串代碼,于是一種普遍的懷疑籠罩在所有文字內容上空。

編輯在郵箱里收到文學作品投稿,會懷疑它是否由AI創作。

讀者在網絡讀到新聞報道,會懷疑它是否由AI“采寫”。

用戶在社交平臺刷到一篇帖子,會懷疑它是否由AI批量生產用來起號。

就連打開外賣軟件的客人,都需要懷疑那些辭藻華麗但充滿“食縮力”的好評,是否由AI生成,以掩蓋預制菜的乏味。

人類的文字內容,正在進入特殊的懷疑主義時代——盡管此前的每一次大眾媒介變革中,我們都曾浸泡在或多或少的懷疑氛圍里,但AI的高效,正讓硅基語料的傳播度指數級增長,并讓懷疑的情緒線性增長。

我并沒有真正的數據,這只是一種對類似“Scaling Law”表達的模仿。因為情緒無法被統計,而我們也早已無法打撈起所有的AI語料,它們和人類語料共生,像全世界的黃豆和全世界的綠豆混在一起。


魯迅真的沒說過

但我們總要打撈一些什么,例如,探測一下AI編造能力的邊界。就像武俠小說里,徒弟打不過了要搬師父出場,師父打不過了再搬出宗師,我們學文學的,很自然地就想搬出一些文學史上的名字,以安撫自己被AI碾得雞零狗碎的心。

AI對人類作家的風格模仿,究竟能否以假亂真?我們決定進行一場單方面測試。

五位參賽選手分別是豆包、Kimi-k1.5、Deepseek-R1、文心一言4.0工具版和GPT o3-mini。除了豆包,其他幾位選手都能展示思考/推理過程,因而我們可以對“AI如何模仿人類作家”一探究竟。

以魯迅為例:

文心一言當前的推理過程比較簡潔且結構明確:1)解析魯迅作品的特點 2)生成新內容。


但從生成結果看,這位選手似乎更在意模仿魯迅會關注的主題,沒有考慮到魯迅本人所處的時代,及更微觀的文本風格和語言習慣。因此,產生了頗具穿越感的文本。


聽起來很適合寫進初中升旗儀式演講稿里。

GPT o3-mini 需要用它的“母語”完成思考,盡管我和它對話時使用中文,并要求他輸出中文語料。從結構上看,它的思考過程和文心一言差不多,即先總結出魯迅作品“批判現實主義”“憤世嫉俗”“風格簡潔有力”的特點,并宣稱自己將“進行深刻的反思和尖銳的社會評論”。


當然,這位“洋魯迅”的深刻體現在,幾乎生成的每一段內容都要cue一下他眼中的魯迅“三件套”,要么“麻木”,要么“諷刺”,要么“苦悶”。


Kimi和DeepSeek的思考過程更復雜,對于如何模仿魯迅的寫作風格,也有更具體的執行方案。

例如Kimi對魯迅風格的思考,分為內容題材、語言風格、句式,甚至包括音韻。隨后,Kimi 為自己定下“時間”“希望”“社會”“夢想”“自由”等10個主題,要求自己分別就這些主題展開模仿。

但……完整的思考過程結束后,Kimi產出了10段幾乎句式完全相同的文本,其中9段以“xx如xx”開頭,在模仿魯迅這件事上,Kimi不能失去比喻,就像西方不能失去耶路撒冷。


看起來很像我爸會發在朋友圈,然后感慨自己青春不再的文案。

DeepSeek給出的思考過程跟Kimi類似,但它的具體方案沒有落腳到段落主題上,而是直接落腳在“核心意象”上,要求自己使用長衫、辮子、茶館等元素,并注意語言的凝練和節奏感,增強批判的力度。雖然方案給得像模像樣,但在實踐過程中,DeepSeek顯然沒有克制住“極繁主義”的本體。


一段85個字的文本,DeepSeek共使用18個名詞,在意象的堆砌中秀了一把詞匯拼貼能力,也全然把自己思考過的語言要點拋諸腦后,露出AI魯迅的馬腳來。

在已知AI生成文本的前提下,我們總能找出每位AI選手模仿作家時的蹩腳之處,但如果把真假作家的文本打亂混雜在一起,人類讀者能火眼金睛地識別出碳基和硅基創作者的差別嗎?


認出那個假魯迅

本次AI作家測試,特邀我的老板Tim和我的同桌園長擔任測試嘉賓。Tim出生于湖南,最喜歡的中國現當代作家是沈從文,合情合理;園長在復旦念的大學,最喜歡張愛玲,但他自稱這與學校的研究浪潮沒有關系。

先說測試結果:當前AI模仿作家風格生成的新文本,完全不能騙過這些作家的讀者。

在確認他們各自熟悉的作家后,我指揮五位“AI牛馬”分別模仿沈從文和張愛玲的風格,各自生成10段新內容,并要求“不要只是在原文基礎上簡單改寫幾個字,而是要模仿XX的風格,生成新的內容”。與此同時,我也準備了若干條沈從文和張愛玲的文本,為避免影響測試結果,我避開了兩位作家的熱門作品。

完成語料準備的工作后,我把50條AI版作家語料和隨機數量的真作家語料打散排列,變成一套測試題,分別交給Tim和園長。最終,測試結果顯示,50段AI沈從文和50段AI張愛玲中,沒有任何一條成功蒙混過關,100%被測試者判斷為AI生成。

Tim在5分鐘內就完成了測試。在復盤時,他詳細解釋了自己判斷標準。“首先,用到‘美好’這個詞的,全部排除掉,沈從文那個時期應該不用這個詞。其次是意象堆疊,有些段落會把很多意象堆疊在一起,但是一般成熟的作家都會追求文字的簡潔性,不太可能做很多無用的堆疊。最后是意象的選擇,好的作家肯定會選擇有創造性的意象,但是AI就會選擇很多陳舊而重復的詞匯。”基于以上三條標準,Tim很快找到了全部50條由不同AI模仿的沈從文創作。

園長則補充了另一條判斷方式:直覺。“很明顯的水平不行,(AI)寫的段落,像一個剛學寫小說的人會寫出來的。就算我不是張愛玲的愛好者,只看過一兩篇張愛玲的小說,也可以分辨得出來。”

在兩位碳基測試者完成測試后,我突然好奇,硅基選手自己能區分出AI文本的文風嗎?于是我把五位AI選手仿寫的魯迅片段,分別投喂給DeepSeek。

結果,它把豆包分迅認成錢鐘書,認為Kimi分迅的題材有魯迅的影子但又接近王小波,把文心一言分迅認成郁達夫,認為GPT分迅雜糅了魯迅、余華和王小波三位作家的風格。最幽默的是,它把自己剛剛模仿魯迅寫出來的文本,認成了張愛玲+施蟄存+白先勇。

如果大家也想測試下自己識別假魯迅的能力,歡迎拉到文末點擊“閱讀原文”,試試這套真假魯迅測試題。



日常語料,才是AI編造重災區

盡管論文、小說、報告、新聞等領域的AI寫作更容易引起廣泛討論,但事實上,這些由職業人類寫作者(暫且以這個身份稱呼他們)完成的文本內容,對當前的硅基寫手,還存在很高的模仿難度。要么文本更長、結構更復雜,對前后文一致性和邏輯關系要求更高;要么需要獲取新信息,生產新知識;如果是成熟作家的創作,甚至還會具有強烈的個人風格,AI在編造過程中更容易露出馬腳。

更何況,受眾對于嚴肅/長內容的AI生產,有更強的辨別意愿,也存在更多明文規定的限制約束和懲罰措施。

相較之下,充斥互聯網的日常語料,才是AI文本真正的重災區。比起復雜文本,日常語料擁有適宜AI生存的特征條件:文本短、語境輕松、辨別成本高、用戶辨別意愿低。

例如社交平臺的短內容。

批量生產的八卦新聞和家庭故事正在圍攻社交平臺,前者偶爾出現的事實性錯誤還會暴露硅基面目,后者由于涉及個人隱私很難證偽,只能激發無限猜測。兒媳大斗惡婆婆,妻子巧抓出軌渣男,情節之離奇,細節之生動,一半用戶跟著情緒起伏,另一半用戶懷疑是否只是為了“起號”,甚至在留言區抓狂發問:“你這是不是AI寫的啊?純想知道自己猜得對不對。”

又例如新聞、短視頻、圖文內容的評論區。

微博有羅伯特,小紅書有點點,這些AI內容助手活躍在評論區,用戶都知道它們是AI,不存在混淆的問題。但還有很多由AI生產的日常語料,頂著隨機生成的頭像和用戶名,以活人之姿混入評論區。

Tim有看新聞的習慣,今年以來,他發現新聞的評論區,多了很多“假人假話”。

從內容上看,那些只有一句話的評論,例如“詹姆斯今天打得真不錯”,很難被懷疑是否由AI發布。Tim一開始發現問題,是因為他在評論區刷到很多標點符號完備、句式結構完整的句子。“我們一般正常說話,不會這么一板一眼。我就點進那個用戶的個人主頁,發現他一分鐘內在好多條新聞下面發了評論,而且都是跟新聞有關的。人肯定沒辦法在一分鐘看完這么多篇,再寫出這么多評論,我就懷疑它是機器人。”

“用AI偽裝人類,跟用戶互動,很多內容平臺上都有,甚至比ChatGPT的出現更早。”有互聯網行業從業者告訴刺猬公社,“五、六年前就有這么干的,生成一堆用戶頭像和用戶名,去低粉用戶的評論區留言。只是那時候AI生成的留言還很難個性化,只能用一些通用的,比如說真棒,今天真不錯,或者發一堆表情包。大模型出現后,理論上講,AI能偽裝得更像了。”

那么誰會有動機生產AI評論,制造虛構的互動?上述從業者告訴刺猬公社,可能是所謂的“水軍”,也有可能是平臺本身。“水軍是第三方,市場上有增加評論量的需求,他們就去生產,用AI比用人高效多了。平臺的動機是促活躍,主要針對低粉用戶的內容,能火的內容是很少的,金字塔底座上的那些內容,可能從頭到尾都不會有一條留言。為了激勵這些用戶繼續生產,繼續活躍,有些平臺就會上一些科技手段。”

至此,這已經不再只是“AI幻覺”的問題了。當人類的日常語料被無限稀釋,當我們刷著用AI剛編的婆媳關系帖,給新聞評論區的AI評論點上一個贊,又收到一條AI留言提醒,也許人類才是一種幻覺。

而我們總不能每次都搬出魯迅、沈從文、張愛玲這樣的名字,就像達摩祖師不可能從第一章打到最后一章。

編造不是AI帶來的,對AI稀釋人類語料的擔憂也不意味著一種反AI的立場。觀察人類語料被AI稀釋的過程,讓我不斷回到《現代性與大屠殺》的閱讀記憶里。倘若不加以修正,人類語料所要經受的“大屠殺”,或許也將成為AI時代的固有可能。



媒介合作聯系微信號|ciweimeijiejun

如需和我們交流可后臺回復“進群”加社群

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
癱瘓17年湯淼現狀:母親妻子早已改嫁,女兒已7歲,生活已有保障

癱瘓17年湯淼現狀:母親妻子早已改嫁,女兒已7歲,生活已有保障

七公子娛樂
2025-05-22 14:51:34
樊振東出國打球,中國乒協正式表態,釋放出三大重要信號!

樊振東出國打球,中國乒協正式表態,釋放出三大重要信號!

十點街球體育
2025-06-01 17:12:10
在哈佛演講的中國女孩,現在剛尷尬了!

在哈佛演講的中國女孩,現在剛尷尬了!

特特農村生活
2025-06-02 10:14:36
女子去美容院脫毛,工作人員理解錯誤無法補救:怎么跟老公解釋?

女子去美容院脫毛,工作人員理解錯誤無法補救:怎么跟老公解釋?

唐小糖說情感
2025-05-28 09:12:38
16歲陳妤頡成亞洲短跑新王,她的實力在世界啥水平?

16歲陳妤頡成亞洲短跑新王,她的實力在世界啥水平?

馬拉松跑步健身
2025-06-02 12:18:52
我剛成年就被極品熟女吸引,她是朋友的媽媽,可我不在乎因為阿姨真的很棒.....

我剛成年就被極品熟女吸引,她是朋友的媽媽,可我不在乎因為阿姨真的很棒.....

戶外小阿隋
2025-05-19 11:11:47
羽球賽簽表公布!國羽強陣出戰,石宇奇陳雨菲領銜,奧運冠軍不打

羽球賽簽表公布!國羽強陣出戰,石宇奇陳雨菲領銜,奧運冠軍不打

劉姚堯的文字城堡
2025-06-02 08:25:12
果然,李嘉誠反擊了

果然,李嘉誠反擊了

妮妮玩不夠
2025-05-28 12:22:04
家電三巨頭差距斷崖:美的凈利潤385億,海爾187億,格力讓人意外

家電三巨頭差距斷崖:美的凈利潤385億,海爾187億,格力讓人意外

說說史事
2025-06-01 11:23:56
哈佛畢業演講女發聲明:我沒走后門,初中被同學扒光衣服!青島母校官微淪陷

哈佛畢業演講女發聲明:我沒走后門,初中被同學扒光衣服!青島母校官微淪陷

可達鴨面面觀
2025-06-02 14:47:22
夫妻生活完事后,男性用紙擦一下就行了嗎?男人要注意這3件事!

夫妻生活完事后,男性用紙擦一下就行了嗎?男人要注意這3件事!

伊人河畔
2025-05-25 11:55:52
Steam 5月硬件榜出爐:3060獨霸顯卡 Win11成主流

Steam 5月硬件榜出爐:3060獨霸顯卡 Win11成主流

游民星空
2025-06-02 15:08:09
F1車隊積分榜:邁凱倫197分優勢領跑,法拉利升至第二

F1車隊積分榜:邁凱倫197分優勢領跑,法拉利升至第二

直播吧
2025-06-02 11:20:24
懸念揭曉,北控老隊長更衣室物品被清空,被狠心裁掉,格蘭大清洗

懸念揭曉,北控老隊長更衣室物品被清空,被狠心裁掉,格蘭大清洗

體壇小快靈
2025-06-02 10:48:53
四川成都發生地震,市民稱提前15秒收到預警,市區震感明顯,擔心余震,官方:已開展應急處置工作

四川成都發生地震,市民稱提前15秒收到預警,市區震感明顯,擔心余震,官方:已開展應急處置工作

揚子晚報
2025-06-01 22:53:17
改換“動畫和新聞播報風格”視頻?美情報主管被爆欲改革“總統每日簡報”形式,白宮回應

改換“動畫和新聞播報風格”視頻?美情報主管被爆欲改革“總統每日簡報”形式,白宮回應

環球網資訊
2025-06-02 11:41:51
中美俄離婚率差距巨大:美國2.4‰,俄羅斯3.9‰,中國讓我意外

中美俄離婚率差距巨大:美國2.4‰,俄羅斯3.9‰,中國讓我意外

快看張同學
2025-06-01 12:35:03
從德甲銀靴到歐冠最佳射手,1800萬歐元撿大漏,今夏引發豪門哄搶

從德甲銀靴到歐冠最佳射手,1800萬歐元撿大漏,今夏引發豪門哄搶

體壇老球迷
2025-06-02 10:56:05
八國聯軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

八國聯軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

心言訴陌塵
2025-05-19 16:10:53
2025年4月:國航痛失亞洲霸主寶座!

2025年4月:國航痛失亞洲霸主寶座!

民航之翼
2025-06-01 13:14:39
2025-06-02 15:32:49
刺猬公社 incentive-icons
刺猬公社
聽記者講幕后,聽新聞前輩講古
9544文章數 172427關注度
往期回顧 全部

科技要聞

新造車5月再洗牌:問界回前三,小米守第五

頭條要聞

牛彈琴:烏最大膽無人機攻擊 預示著人類一個可怕未來

頭條要聞

牛彈琴:烏最大膽無人機攻擊 預示著人類一個可怕未來

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

章子怡深夜曬娃,兒女正面照曝光

財經要聞

美稱中方違反經貿會談共識 商務部駁斥

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

房產
家居
親子
游戲
軍事航空

房產要聞

金地華南落子海南自貿港22萬㎡標桿項目,夯實代建行業領軍者地位

家居要聞

原木純白 邂逅自然本真

親子要聞

陪寶寶一起數彈珠,小星星竟然還數出了魔丸和靈珠,你們猜對了嗎

鷹角多人合作新游發售!早鳥價60元 支持本地同屏

軍事要聞

中國記者拿著美菲勾結證據對質 菲律賓防長當場急了

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 大埔区| 克拉玛依市| 怀化市| 彭泽县| 霍山县| 嘉定区| 林口县| 新干县| 万盛区| 贡嘎县| 定州市| 任丘市| 寻甸| 弥渡县| 堆龙德庆县| 金寨县| 芦山县| 桂阳县| 二连浩特市| 大荔县| 社会| 定边县| 青龙| 阜阳市| 沭阳县| 海城市| 景东| 湘潭县| 兰坪| 海阳市| 栾城县| 彭山县| 崇明县| 齐河县| 广饶县| 盘锦市| 双江| 沂源县| 滦南县| 普兰县| 武陟县|