「天臨七年」,畢業(yè)論文除了查重之外又多了一道關(guān)卡—— AIGC 檢測(cè)(人工智能生成內(nèi)容檢測(cè))。
文章來(lái)源|APPSO(ID:appsolution)
「天臨七年」,畢業(yè)論文除了查重之外又多了一道關(guān)卡—— AIGC 檢測(cè)(人工智能生成內(nèi)容檢測(cè))。
為了避免學(xué)術(shù)不端,不少高校開(kāi)始把 AIGC 檢測(cè)結(jié)果作為論文能否通過(guò)的要求之一。
作為一名剛剛結(jié)束答辯的畢業(yè)生,前一段時(shí)間可是和 AIGC 檢測(cè)周旋了許久。經(jīng)歷了「檢測(cè)—修改—再檢測(cè)—再改」的痛苦循環(huán)后,終于從 61.7% 降到 0%。
這個(gè)過(guò)程之所以這么讓人崩潰,是因?yàn)?AIGC 檢測(cè)真的不講武德:
有些明明是自己一個(gè)字一個(gè)字敲下的,也會(huì)被整段標(biāo)紅,判定為 AI 生成;在這一個(gè)平臺(tái)上測(cè)出的 10%,換個(gè)平臺(tái)又可能測(cè)出 100%;而哪怕是在同一個(gè)平臺(tái),同一個(gè)段落這次測(cè)是 0%,下次可能就變成 100%。
這不禁讓我深深懷疑,當(dāng)前的 AIGC 檢測(cè)和它最初的目的是否已經(jīng)偏離?從更大的層面來(lái)講,它會(huì)對(duì)我們的寫作和思考方式造成怎么樣的影響?
在「降 AI」的過(guò)程中,為了降低那個(gè)數(shù)字,內(nèi)容好壞變成了次要的事。論文被改得七零八落、面目全非只為了證明「我不是 AI」。與此同時(shí),我還額外支付了不少 AIGC 檢測(cè)費(fèi)用。
證明自己沒(méi)用 AI,成為學(xué)生新的噩夢(mèng)
上網(wǎng)一搜,發(fā)現(xiàn)一樣被 AIGC 檢測(cè)折磨的畢業(yè)生不在少數(shù),大家都叫苦不迭。
23 歲的美國(guó)大學(xué)生 Burrel,在一門寫作必修課的期末測(cè)試中得了 0 分,教授給出的理由,是懷疑她這篇作文是由 AI 代筆的。
「我的心跳都快停了。」 Burrel 認(rèn)為,這個(gè)指控既荒謬又可怕。
Burrel 稱這份模擬求職信的作業(yè)完全沒(méi)依賴 AI ,她給《紐約時(shí)報(bào)》展示了 Google 文檔的編輯歷史記錄,她表示花了整整兩天時(shí)間來(lái)起草和修改這份作業(yè)。
不過(guò)全球知名查重公司 Turnitin 所提供的 AI 檢測(cè)結(jié)果顯示,這篇文章有 AI 寫作的痕跡。
為了證明自己的清白,Burrel 向英語(yǔ)系主任提交了一份長(zhǎng)達(dá) 15 頁(yè)的 PDF 文件,里面包含了她寫作過(guò)程中所有帶時(shí)間戳的屏幕截圖和筆記。
最終,她的成績(jī)被恢復(fù)了。但這次經(jīng)歷給 Burrel 留下了不小的陰影。
在那次被指控后,當(dāng) Burrel 再次提交作業(yè)時(shí),她上傳了一段長(zhǎng)達(dá) 93 分鐘的 YouTube 視頻,完整記錄了她的寫作全過(guò)程。
「我很害怕會(huì)因?yàn)橐患约簺](méi)做過(guò)的事而影響成績(jī)。」
Turnitin 尚未回應(yīng)這一報(bào)道,但其首席產(chǎn)品官 Annie Chechitelli 曾在 2023 年的一篇博客文章中指出,AI 檢測(cè)分?jǐn)?shù)不應(yīng)被用作判斷學(xué)生是否濫用 AI 的唯一決定性因素。
現(xiàn)在美國(guó)已經(jīng)有一些高校學(xué)生在網(wǎng)上發(fā)起請(qǐng)?jiān)福笏麄兯诘拇髮W(xué)停止使用類似的 AI 檢測(cè)工具,隨著 AI 工具的滲透,可以預(yù)見(jiàn)這樣的矛盾將在學(xué)生和老師之間愈發(fā)頻繁出現(xiàn)。
搞懂 AIGC 檢測(cè)的基本邏輯
AIGC 檢測(cè)結(jié)果為什么總像是隨機(jī)生成的?它的檢測(cè)邏輯究竟是什么?畢竟只有理解它的原理,才能在「降 AI」時(shí)對(duì)癥下藥。
傳統(tǒng)的論文查重主要是與已有文獻(xiàn)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),查重報(bào)告會(huì)明確告訴你是哪些段落和哪篇文獻(xiàn)重復(fù)了。
所以對(duì)于傳統(tǒng)「降重」,前人已經(jīng)摸索出一套有效的「打法」,比如改寫句子結(jié)構(gòu)、同義詞替換、翻譯成小語(yǔ)種再翻譯回中文……總之,只要能避開(kāi)與已存在文獻(xiàn)的重復(fù),就能過(guò)關(guān)。
但到了 「降 AI 」這里,這些已有的經(jīng)驗(yàn)似乎都失靈了:
AIGC 檢測(cè)更像一個(gè)黑箱,標(biāo)準(zhǔn)不明。目前任何一種檢測(cè)手段都無(wú)法保證 100% 判定哪個(gè)是 AI 寫的,哪個(gè)是人類寫的。因此,檢測(cè)系統(tǒng)通常都會(huì)給出一個(gè) AIGC 疑似值。
雖然說(shuō)這只是「疑似度范圍」,系統(tǒng)也聲明「檢測(cè)結(jié)果與論文質(zhì)量無(wú)關(guān)」,但一旦超過(guò)某個(gè)數(shù)值,論文就會(huì)實(shí)打?qū)嵉夭煌ㄟ^(guò)啊,讓人有種無(wú)處申訴的無(wú)力感。
就連人大新聞學(xué)院副教授董晨宇也要在 AIGC 檢測(cè)中被迫「自證清白」:他的研究團(tuán)隊(duì)的一篇耗時(shí)三年、基于真實(shí)案例撰寫的關(guān)于直播產(chǎn)業(yè)的研究論文,卻被某論文檢測(cè)平臺(tái)標(biāo)注為「高度疑似AI生成」。
:https://www.bilibili.com/video/BV1WK7fzNEa5/?spm\_id\_from=333.337.search-card.all.click&vd\_source=2304bb3a0ff80390775707914f5ee0ed
所以,AIGC 檢測(cè)真的就是「黑箱」嗎?它的基本邏輯究竟是什么?
Chat GPT 是這樣說(shuō)的:
另外,基于知網(wǎng)在 2023 和 2024 年發(fā)布的兩個(gè)專利,我們也可以總結(jié)目前知網(wǎng) AIGC 檢測(cè)的底層邏輯和流程:
第一階段:信息量差值檢測(cè)(基于 2023 年專利)
輸入文章,按學(xué)科分類
用大語(yǔ)言模型改寫文章,計(jì)算原文與改寫版的信息量
差值差值小 → 可能 AI 生成;差值大 → 可能人類寫作
第二階段:多特征分析(基于 2024 年專利)
使用文本分類模型計(jì)算 AI 生成概率
分析邏輯偏離度、詞匯擴(kuò)散度、句子長(zhǎng)度、字詞分布等特征
綜合多個(gè)特征判斷 AI 生成可能性
第三階段:最終判定
結(jié)合兩階段結(jié)果
兩階段均指向 AI → 判定 AI 生成
否則 → 判定人類寫作
既然如此,似乎有標(biāo)準(zhǔn)可循。那依據(jù)這個(gè)標(biāo)準(zhǔn),讓 AI 擬人化改寫文章,以此增加「人味」、降 「AI 味」,豈不是可以用魔法打敗魔法?
用 AI 降 AI ?真的有用嗎?
我試過(guò)市面上流傳的兩類 「用 AI 降 AI」的方法:
輸入 prompt,讓大模型對(duì)原文本進(jìn)行改寫
使用專門的「一鍵降 AI」工具(多為付費(fèi)服務(wù))
拿我的論文當(dāng)小白鼠,將幾段文字(人工撰寫+ Chat GPT 潤(rùn)色共 972 字)丟進(jìn)一個(gè)大學(xué)生常用的免費(fèi) AI 查重平臺(tái)「PaperYY」平臺(tái)進(jìn)行 AIGC 檢測(cè),檢測(cè)結(jié)果 AIGC 疑似率為 61.7%。
接下來(lái)依次使用下面表格中的幾種「用 AI 降 AI」的方法分別改寫這段文本,并再次放入同一檢測(cè)平臺(tái) PaperYY 上進(jìn)行檢測(cè)。
同時(shí),作為對(duì)照,將購(gòu)買檢測(cè)平臺(tái) PaperYY 上自帶的「降 AI」服務(wù)進(jìn)行測(cè)試。
: 筆棧: https://biee.net/; SpeedAI: https://speedai.fun/; PaperYY: https://www.paperyy.com/
方法一:人工指令
分別喂給 GPT、DeepSeek 和 Grok 一段相同的「降 AI」指令:
但結(jié)果仿佛養(yǎng)蠱,三個(gè) AI 各自一頓操作之后,AIGC 率全都成功從61.7% 升到100%……
不過(guò),接收同樣的 prompt,GPT 和 Grok 改寫的文本風(fēng)格比較相似,語(yǔ)言較平實(shí),但 DeepSeek 卻出現(xiàn)了明顯的「AI 幻覺(jué)」,開(kāi)始變得不像人話……
如原文在描寫攝影技法的時(shí)候,僅僅提到「色彩反轉(zhuǎn)、低角度構(gòu)圖、光源的超現(xiàn)實(shí)處理」等,但 DeepSeek 卻自行發(fā)明了「放射性構(gòu)圖」、「異色溫處理」、「鎢絲燈頻閃」等,并存在堆砌復(fù)雜詞匯的現(xiàn)象,使得與原文有較大偏離。
方法二:「一鍵降 AI」工具
我選取了兩款市面上專門的論文寫作與查重網(wǎng)站中的「降 AI」工具——「筆棧」和「SpeedAI」進(jìn)行測(cè)試。
筆棧改寫后 AIGC 率飆升至91.5%,似乎已經(jīng)沒(méi)有什么好意外的了。
但神奇的是,SpeedAI 的改寫文本居然測(cè)出了 0%,反倒令人大跌眼鏡。
對(duì)照測(cè)試:檢測(cè)平臺(tái) PaperYY 上的付費(fèi)降A(chǔ)I服務(wù)
在付了「降 AI」費(fèi)之后,PaperYY「自己答題自己改卷」的測(cè)試結(jié)果倒不出意外的是 0%。
測(cè)試結(jié)果:初始文章 AIGC 檢測(cè)結(jié)果:61.7%
除了在 PaperYY 平臺(tái)的對(duì)照測(cè)試外,真正能較好完成「降 AI」任務(wù)的,竟只有 SpeedAI。
然而,這一結(jié)果并不能證明 SpeedAI 在「降 AI」方面表現(xiàn)出色,反而使整個(gè)測(cè)試顯得更加撲朔迷離。
于是,我們進(jìn)一步選取了兩個(gè)極端案例——ChatGPT 改寫后被判定為 100% AIGC 的「文本一」與 SpeedAI 改寫后被判定為 0% 的「文本二」,讓 Grok 對(duì)其進(jìn)行詳細(xì)的對(duì)照分析。
乍一看似乎有點(diǎn)道理,然而回到具體文本,我們會(huì)發(fā)現(xiàn) Grok 不過(guò)是照著已有結(jié)論套說(shuō)辭,「錘子找釘子」罷了,實(shí)際上:
SpeedAI 生成的「文本二」中同樣使用了很多抽象的理論詞匯如「社會(huì)象征」「敘事裝置」等;
ChatGPT 生成的「文本一」中其實(shí)具有更多處以「我」作主語(yǔ)的所謂口語(yǔ)化表達(dá)。
但話說(shuō)回來(lái),如果論文中都是充滿「人味」的口語(yǔ)表達(dá),而缺少專業(yè)理論詞匯,還能叫學(xué)術(shù)論文嗎?邏輯清晰、條理分明的表達(dá)方式,什么時(shí)候變成 AI 專屬了呢?
寫作本該是思考與表達(dá),而非證明「我不是 AI」
筋疲力竭地「降 AI」之后,盡管我的論文順利通過(guò)了系統(tǒng)檢測(cè),但很多地方也變成了我不認(rèn)識(shí)的樣子。
在這個(gè)過(guò)程中,最終的論文質(zhì)量似乎不再是衡量的標(biāo)準(zhǔn),關(guān)鍵變成了如何向系統(tǒng)證明我不是用 AI 寫的。
這種本末倒置的操作消耗了我很多本該投入在論文思考、打磨和創(chuàng)新中的時(shí)間、精力和金錢。
更加可怕的是,對(duì)于學(xué)生而言,這種章法不明的「標(biāo)準(zhǔn)」可能會(huì)變成一個(gè)無(wú)形的框架,窄化我們的語(yǔ)言表達(dá),甚至約束我們的思維。
當(dāng)我們不再專注于深入思考問(wèn)題,而是不斷琢磨如何迎合這一「標(biāo)準(zhǔn)」,就會(huì)逐漸失去寫作應(yīng)有的創(chuàng)造力、想象力和自我表達(dá)的功能。
對(duì)此,人大副教授董晨宇表示:
「AI 其實(shí)在倒逼學(xué)術(shù)生產(chǎn)進(jìn)行重新布局,適應(yīng)這種布局,需要進(jìn)行非常整體性的調(diào)整,但在這一切之前,應(yīng)激式的防火防盜防 AI 一定是我們最開(kāi)始的反應(yīng)。但 AI 不是現(xiàn)代人的旁門左道,而是現(xiàn)代人的生存之道。AI 提高了底線,但是人仍然決定的是上限。」
所以,真正決定論文價(jià)值的,不該是系統(tǒng)判定的一個(gè)數(shù)值,而是其中凝結(jié)的思考深度與寫作誠(chéng)意。
盡管 AI 提高了寫作的底線,但人類不必與工具對(duì)抗,而應(yīng)在理解它、駕馭它之后,繼續(xù)追求屬于人的表達(dá)上限。
媒介合作聯(lián)系微信號(hào)|ciweimeijiejun
如需和我們交流可后臺(tái)回復(fù)“進(jìn)群”加社群
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.