AI時(shí)代會(huì)淘汰的不是不會(huì)用AI的人,而是不用AI的人。短短兩年半的時(shí)間,AI就已然從玩具進(jìn)化到了生產(chǎn)力工具,當(dāng)下如果要說(shuō)哪一個(gè)群體擁抱AI的力度最大,或許并非正在被AI取代的打工人,而是還處于象牙塔里的學(xué)生黨。
早在AI大模型剛剛問(wèn)世的2023年,當(dāng)這類產(chǎn)品還存在道德和法律風(fēng)險(xiǎn)的情況下,ChatGPT就已經(jīng)在全世界的大學(xué)校園里“泛濫”,許多學(xué)生熱衷于在ChatGPT的幫助下完成作業(yè)、乃至撰寫論文,而各大高校則開(kāi)始評(píng)估如何阻止學(xué)生使用AI技術(shù)來(lái)作弊。到了2025年,大批高校首次將“AI生成內(nèi)容檢測(cè)”納入畢業(yè)論文的審查環(huán)節(jié),也讓一眾大學(xué)生手忙腳亂地給論文降低“AI味”。
如今,“論文AI率高到離譜”已經(jīng)成為社交平臺(tái)上的熱門話題,為了不讓自己的論文被判定為長(zhǎng)著一張AI臉,不少學(xué)生選擇尋求“場(chǎng)外援助”,也就是“代降論文AI率”的槍手團(tuán)隊(duì)幫助。
但作為典型的灰產(chǎn),亂象頻發(fā)幾乎是必然。日前,《法治日?qǐng)?bào)》針對(duì)代降論文AI率服務(wù)的亂象進(jìn)行了調(diào)查,發(fā)現(xiàn)相關(guān)服務(wù)效果堪憂、貓膩重重,學(xué)生花費(fèi)不菲卻常常陷入維權(quán)無(wú)門的窘境。
“AI降重,一分鐘完成從100%到5%”、“去除AI寫作痕跡,推薦給所有煩惱的大學(xué)生”這類與降低論文AI率有關(guān)的小廣告,在剛剛過(guò)去的畢業(yè)季幾乎遍及抖音、小紅書(shū)、知乎等平臺(tái)。由于只需花一點(diǎn)小錢就能獲得一根“救命稻草”,因?yàn)閷?duì)于前期使用AI工具導(dǎo)致論文無(wú)法通過(guò)AI審查的學(xué)生來(lái)說(shuō),可謂是如獲至寶。
據(jù)《法治日?qǐng)?bào)》記者的調(diào)查,提供論文修改服務(wù)的商家多以“人工修改”、“包過(guò)檢測(cè)”為噱頭,向買家提供降低論文AI率的服務(wù),收費(fèi)則從幾十元至上千元不等,可實(shí)際效果卻一塌糊涂。比如一位受訪者就表示,“不該改的全改,該改的亂改,句子語(yǔ)言混亂。AI率是降了,但論文被改成了‘口水文’。”
在這一眾問(wèn)題中,最突出莫過(guò)于商家打著“人工手動(dòng)”的旗號(hào)、卻基本是使用AI來(lái)修改論文,以至于出現(xiàn)語(yǔ)句不通、修辭通俗化、文字口語(yǔ)化等典型特征。
那么問(wèn)題就來(lái)了,為什么代降論文AI率服務(wù)最終的歸宿一定是用AI來(lái)降A(chǔ)I率呢?其實(shí)這是技術(shù)性和經(jīng)濟(jì)性共同促成的結(jié)果。
毫無(wú)疑問(wèn),商家推出代降論文AI率服務(wù)是為了獲利,并且這一行為本身涉及學(xué)術(shù)不端,屬于典型的灰色地帶,所以即便是被坑騙的受害者也很難維權(quán)。別的不談,商家一個(gè)“舉報(bào)至學(xué)校”就足以讓學(xué)生偃旗息鼓。如此一來(lái),即便商家嘴上說(shuō)著“人工”,實(shí)際上卻使用AI來(lái)改寫論文,稱得上是一本萬(wàn)利的買賣。
寫過(guò)論文的朋友都知道,從零開(kāi)始寫一篇數(shù)萬(wàn)字的論文與半途接手一篇再改寫,所花費(fèi)的時(shí)間幾乎沒(méi)有差別。如果商家真的使用人工來(lái)降低論文AI率,收費(fèi)就不可能是幾十元、數(shù)百元,而至少是數(shù)千元的水平。作為一個(gè)依托于“信息差”的灰產(chǎn)賽道,老老實(shí)實(shí)用人工顯然對(duì)于賺錢來(lái)說(shuō)毫無(wú)意義。
更關(guān)鍵的原因是當(dāng)下AI檢測(cè)與論文查重的準(zhǔn)確性不可同日而語(yǔ),“用AI監(jiān)管AI”暫時(shí)并不奏效。早在ChatGPT登場(chǎng)不久,OpenAI就預(yù)見(jiàn)到了生成式AI將會(huì)成為虛假信息的“幫兇”,因此開(kāi)發(fā)了一款A(yù)I文本檢測(cè)器(AI Text Classifier)試圖區(qū)分人工編寫文本與AI生成文本。
然而遺憾的是,僅僅上線半年時(shí)間,OpenAI方面就下架了這款A(yù)I文本檢測(cè)器,原因是檢測(cè)的準(zhǔn)確率過(guò)低,準(zhǔn)備來(lái)說(shuō)是假陽(yáng)性率難以接受。事實(shí)上,不僅僅OpenAI做不到,Turnitin、GPT Zero、Compilatio等聲稱具備檢測(cè)AI內(nèi)容的工具也一樣,假陽(yáng)性率過(guò)高的問(wèn)題一直都難以解決。
其中一個(gè)非常典型的案例,是非英語(yǔ)母語(yǔ)者寫的文章常被錯(cuò)誤地標(biāo)識(shí)為由AI生成。這個(gè)反直覺(jué)的現(xiàn)實(shí)所導(dǎo)致的結(jié)果,就是文本內(nèi)容中書(shū)面化的程度越高,就越會(huì)被AI文本檢測(cè)工具標(biāo)識(shí)出來(lái)。因?yàn)楫?dāng)下主流的AI檢測(cè)工具往往使用的是基于零樣本學(xué)習(xí)的檢測(cè),也就是根據(jù)AI生成文本的特征來(lái)辨識(shí)內(nèi)容。
人類與機(jī)器在文本生成過(guò)程中傾向于選擇不同的詞匯,其中人類的選擇比較多樣,機(jī)器則更傾向于有更高模型概率的詞匯,因?yàn)榛诖笠?guī)模語(yǔ)料庫(kù)預(yù)訓(xùn)練的AI模型反映的是人類的集體寫作行為,而非個(gè)體行為。比如,人類創(chuàng)作的文本則顯得更加隨心所欲,每一句的水平也會(huì)參差不齊,而AI生成的文本內(nèi)容則更注重規(guī)范化表達(dá)。也就是說(shuō),寫的更規(guī)范、更嚴(yán)謹(jǐn)?shù)氖茿I,更隨心所欲的是人工。
但論文的寫作相當(dāng)強(qiáng)調(diào)規(guī)范化,這恰恰是AI所擅長(zhǎng)的領(lǐng)域。如此一來(lái),在AI檢測(cè)工具的“照妖鏡”之下,明明有的同學(xué)只是使用了AI進(jìn)行潤(rùn)色,結(jié)果AI率卻會(huì)直接突破50%。
針對(duì)這一現(xiàn)象,提供代降A(chǔ)I率的商家就利用了“信息差”。關(guān)于AI檢測(cè),其實(shí)已經(jīng)有相當(dāng)多的學(xué)者進(jìn)行了研究,并發(fā)現(xiàn)當(dāng)文本長(zhǎng)度低于1000字符,或整篇文章均采用短句構(gòu)成時(shí),AI檢測(cè)的準(zhǔn)確率會(huì)驟降至隨機(jī)水平以下,而這則是源于短文本中語(yǔ)言特征的稀疏性,導(dǎo)致統(tǒng)計(jì)規(guī)律難以捕捉。
換而言之,越是口語(yǔ)化的內(nèi)容,AI就越會(huì)認(rèn)為是人寫的。這也是為什么網(wǎng)絡(luò)上流傳出的降低論文AI率妙招是“改寫句子結(jié)構(gòu)”,將長(zhǎng)句、復(fù)合句分割成短句、句群,這也就對(duì)上了部分同學(xué)口中的“論文被改成‘口水文’”。商家只需要通過(guò)“說(shuō)人話、減少人機(jī)感、不使用長(zhǎng)難句”等提示詞,即可輕松讓論文的AI率斷崖式下降。
可問(wèn)題是這一番操作下來(lái),盡管AI率是低了,可論文本身也沒(méi)法看了。當(dāng)然,這也不是個(gè)大問(wèn)題,畢竟這個(gè)賽道沒(méi)什么售后可言,商家在畢業(yè)季能騙一個(gè)就是一個(gè),根本沒(méi)有做長(zhǎng)期生意的打算。畢竟大家也不能指望一個(gè)灰產(chǎn)賽道的參與者,會(huì)主動(dòng)選擇做大做強(qiáng),因?yàn)榭诒畬?duì)他們可以說(shuō)是毫無(wú)意義。
歸根結(jié)底,在OpenAI、谷歌的“文字水印技術(shù)”落地之前,AI文本檢測(cè)并不是說(shuō)有多像AI寫的,而是檢測(cè)論文多像ChatGPT、豆包等常見(jiàn)大模型寫的。除非代降A(chǔ)I率的團(tuán)隊(duì)真的是人工修改,否則降低“AI味”注定就只能是招搖撞騙。
【本文圖片來(lái)自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.