看到今年的畢業(yè)季,估計王勃會氣得從地里爬出來,把開發(fā)AIGC檢測模型的人電腦插頭拔了。
事情是這樣的,今年很多學校為了防止學生用AI寫畢業(yè)論文,在論文送審時加了一項“AIGC檢測”,意思就是檢測你文章里多少內(nèi)容是由AI生成的。
起初,這條公告并沒有掀起什么波瀾。
但直到最近,大伙的論文都接近尾聲了,才發(fā)現(xiàn)這玩意兒讓大伙的畢業(yè)季變成了走馬燈。
“我寫的內(nèi)容會被識別成AI,而AI寫的反而不會被識別成AI,因此AI檢測論文就是在檢測誰能把話說的更不像人話。”25屆畢業(yè)生小蛋如是說,此處內(nèi)含臟話過濾器。
大伙發(fā)在網(wǎng)上的評論,更是一個比一個離譜。
因為自己寫得太專業(yè),被檢測成AI寫的。
有給導師改一遍,AI生成疑似度反而漲了的。
甚至有人把《滕王閣序》塞進去,發(fā)現(xiàn)其AI生成疑似度高達驚人的99.2%。
這下合理了,原來咱勃哥開的是AI掛,我就知道沒人能即興寫出這么好的文章。
我估計是因為,這文章寫得太華麗了,對仗工整,用典密集,信息密度巨大,跟現(xiàn)在的AI文章確實是有點相似之處的。。
而且,你猜怎么著?AI生成疑似度的檢測,也是由AI進行的。
這活兒,別說碳基生物了,硅基生物都想不到,自己被設計出來,要幫人寫文章,改文章,還要幫你猜猜這文章是不是人寫的??早知道上輩子爛在服務器里了。
為了和廣大畢業(yè)生感同身受,咱也掏出了同事珍藏已久的畢業(yè)論文,用了大伙的同款工具來試試水。
從結(jié)果來看還可以,能勉強能達到畢業(yè)要求,看來論文含金(shi)量還是有的。
但從過程來看,就有點搞笑了。
比如,這段就是單純的名詞解釋,你讓人來寫和AI來寫都是這么個解釋,客觀規(guī)律不以人類意志為轉(zhuǎn)移。但它覺得是AI生成的,意思是我還得加點修辭手法嗎?
而這段呢,是我對前人工作的總結(jié),看過論文的人都知道,包不可能一個字一個字看的呀。這個部分其實是我把文獻丟給AI讓AI總結(jié),最后一句一句拼起來的。然而,它并沒有檢測出來。
所以說,要是同事畢業(yè)那年有這指標,還真得開罵,這結(jié)果根本就不準啊。
更何況一共四萬多字,就要了我84塊。。如果有人AI生成疑似度死活降不下去的話,我能感受到一種砸鍋賣鐵的絕望。
而且,這股潮流不光在國內(nèi)涌動。身處英國的老樹同學表示,“基本上所有小組作業(yè)都要檢測一遍,而且相當不準。。身邊同學都挺煩這玩意的。”可以說全世界都籠罩在AI的烏云之下。
而之前,咱也就試了一下論文這種專業(yè)性強的東西,我就很好奇啊,它是不是啥也不準。于是我當場手碼了一段文字,讓AI給我檢測下。
看這無敵的邏輯性,就知道AI肯定寫不出來。
然后提交上去。
于是,我的努力和汗水化為了一串冰冷的97.77%。
所以,檢測AI生成疑似度的原理到底是啥?不能AI說啥就是啥吧?
沒想到吧,還真是。
當你把文字輸入檢測工具時,它會分析這段文字的各種語言特征,包括詞匯、句子結(jié)構、段落銜接方式等等。。然后,它會將這些特征與AI的寫作模式進行對比。
對比分析后,檢測工具就會得出一個判斷,并不是絕對地告訴你“是”或“不是”,而是一個基于語言特征的概率推斷。
但這種玩意其實就沒準過。
像OpenAI在ChatGPT剛發(fā)布時,就推出了自己的AI文本識別工具AI Text Classifier。但準確性就很拉了,只有約26%,還把莎士比亞的作品當成AI生成的。。
這種文本分類器的原理也很簡單,本質(zhì)上就是一個經(jīng)過特殊訓練的模型,用來捕捉AI與人類文本之間的差異。
當AI寫出的文本越來越像人類,分類器也越來越難跟上這種變化,導致它的判斷完全不準確,甚至比瞎蒙還不準確。。就算它看出來了,你隨便加一點,它也就看不出來了。
再說了,刨去準不準的事兒不提,AI本身就是用來模仿人的寫作風格的。。把人類的文章拿來訓練AI,再把AI拿來檢驗人類寫出的文章像不像AI,本身就有一種“爸爸像兒子”般的荒謬。
意思是AI學會了我的寫作風格,我就再也不能用這種風格了嗎?那留給人類的時間不多了。
而且,擁有不確定性,就意味著一定會導致誤傷。拿這個作為畢業(yè)指標,是不是有點拼運氣了?這一整,沒有大保底,非酋怕是畢不了業(yè)了,肄業(yè)原因是臉太黑。
于是,大家只能費盡心思,把自己的文章改得越來越不像人。
但,查完這個AI生成疑似率,才算邁過了第一道坎兒。
寫過論文的朋友們都知道,很多大學都有自己的檢測系統(tǒng),卻不喜歡給學生試用,為了順利畢業(yè),學生只能自掏腰包去第三方網(wǎng)站自查。
查重降重這種東西本來就要花錢。。而現(xiàn)在又多了一項指標,就意味著要花錢的地方又多了一頭。
但有個非常奇特的現(xiàn)象,用不同網(wǎng)站測同一篇文章,AI生成疑似度完全不一樣,甚至相同網(wǎng)站不同時間的結(jié)果也不一樣。
這導致學生被迫成了無頭蒼蠅——誰主張誰舉證,這些網(wǎng)站都在主張你疑似使用AI,但根本沒有證據(jù),甚至沒有一個統(tǒng)一的標準。所以,到底要怎么改呢?
這時,你再點進這些網(wǎng)站,就會發(fā)現(xiàn)從AI寫作,AI查重,AI降重,AIGC檢測,到降AI生成疑似度,所有需求,一站滿足,哪里不會點哪里,結(jié)果嘛就是都要掏錢。。甚至有的網(wǎng)站還會故意拉高這些數(shù)字,目的嘛,也就可想而知了。
所以,畢業(yè)論文,真有必要檢測AI生成疑似度嗎?我們來看看教育部對畢業(yè)設計的要求:
可以看出,本質(zhì)上,就是檢驗你大學四年有沒有學到真東西,擁有發(fā)現(xiàn)問題、解決問題的能力。
所以,理論上只要把活老老實實干完,保證實驗嚴謹,數(shù)據(jù)真實,就達到要求了。用AI把我的工作,用學術風格寫出來又怎么了?
AI的發(fā)明就是用來減輕人類負擔的,它們早已成為很多研究者工作中的一部分。
中科院理化研究所的楊曉濤博士就曾表示過,單位和導師都鼓勵科學家學習使用AI工具,也會讓他們思考如何與科研結(jié)合。而高校卻不允許我們的學生使用AI,又怎么能接近真正的研究者呢。
當然,或許真的有這種學生,基本全篇都用AI生成,確實是在蒙混過關。
但,這其實也很好解決。AI用多了,你就會發(fā)現(xiàn),肉眼辨AI基本上就夠用了。
太離譜的文章,一眼能看出來是AI一作的,肯定是過不了關的。但一眼看不出來的,說明和人寫的已經(jīng)所差無幾了——只要內(nèi)容詳實,又何必在意詞句?
與其糾結(jié)AI生成疑似度,不如把目光放到內(nèi)容真實性上來,一篇論文中包含的努力和汗水,才是其中最寶貴的東西。
總之,AI被發(fā)明的初衷是服務人類,現(xiàn)在讓大家和AI斗智斗勇,屬實是有點沒事找事了。
處在AIGC元年的大伙,在此刻也終于理解了王勃——時運不齊,命途多舛;三尺微命,一介書生。
撰文:不咕
編輯:江江&面線
美編:萱萱
圖片、資料來源:
福州大學教務處、小紅書、抖音、知網(wǎng)、X
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.