99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)不起,AI 模型通過(guò)圖靈測(cè)試了,我也分不清誰(shuí)是人了

0
分享至

(關(guān)注公眾號(hào)設(shè)為標(biāo),獲取AI深度洞察)

全文2,000字 | 閱讀約10分鐘



今天看到一個(gè)新聞,我沉默了三秒。

最近GPT-4.5,在一場(chǎng)標(biāo)準(zhǔn)圖靈測(cè)試?yán)铮?73% 的人誤認(rèn)成人類。

什么意思?

就是在一個(gè)實(shí)驗(yàn)里,讓人類分別跟兩位“答題者”對(duì)話——其中一個(gè)是人,另一個(gè)是 AI,結(jié)果大多數(shù)人把 AI 當(dāng)成了真人。準(zhǔn)確地說(shuō),是 OpenAI 的 GPT-4.5,被判定“更像人”。

這不是“差點(diǎn)贏”,是直接贏了,贏得還挺離譜。

而且它還不是隨便聊兩句就騙到人,是在模擬“年輕文化通”人設(shè)的狀態(tài)下,壓倒性勝出。

一句話總結(jié):

人類盯著人類和 AI 聊天,結(jié)果把 AI 當(dāng)成人類,把人類當(dāng)成了 AI。

你說(shuō)巧不巧。

這場(chǎng)實(shí)驗(yàn)的結(jié)果發(fā)布在一篇還在同行評(píng)審的論文里,但實(shí)驗(yàn)設(shè)計(jì)非常標(biāo)準(zhǔn)、執(zhí)行也很嚴(yán)謹(jǐn),做這個(gè)的是加州大學(xué)圣迭戈分校語(yǔ)言與認(rèn)知實(shí)驗(yàn)室,不是那種 PPT 創(chuàng)業(yè)公司搞的“AI自測(cè)”。

我當(dāng)時(shí)就想:

圖靈測(cè)試,這個(gè) 1950 年就被提出來(lái)的“模仿游戲”,現(xiàn)在真的要退休了。

2|什么是圖靈測(cè)試?以前真沒(méi)人能過(guò)

這時(shí)候你可能會(huì)問(wèn):

等等,圖靈測(cè)試到底是個(gè)啥?為啥 73% 的誤判聽(tīng)起來(lái)這么嚇人?

簡(jiǎn)單說(shuō),這是 1950 年艾倫·圖靈提出來(lái)的一個(gè)問(wèn)題:

“如果一個(gè)機(jī)器能在對(duì)話中騙過(guò)你,讓你以為它是人,那它是不是就具備智能了?”

于是他設(shè)計(jì)了一個(gè)“模仿游戲”:

  • A 是機(jī)器

  • B 是人

  • C 是裁判

  • 裁判分別跟 A 和 B 聊天,如果不能判斷誰(shuí)是人,誰(shuí)是機(jī)器,那就算機(jī)器“贏了”

這個(gè)測(cè)試后來(lái)成了衡量 AI 智能的經(jīng)典標(biāo)準(zhǔn)之一,雖然現(xiàn)在不少專家也覺(jué)得它已經(jīng)不太科學(xué)了,但它依然有個(gè)重要意義:

它不是在測(cè)試 AI 的智力,而是在測(cè)試人類能不能識(shí)破偽裝。

以前沒(méi)人能真過(guò)這個(gè)測(cè)試,哪怕你拿 GPT-3 去試,也很容易暴露自己“詞語(yǔ)重復(fù)”“邏輯出軌”或者“裝懂胡說(shuō)”。

之前流行的那個(gè)聊天機(jī)器人 ELIZA,在 60 年代就玩過(guò)“心理醫(yī)生模仿術(shù)”,效果嘛……就像你拿 ChatGPT 扮演前女友——能聊,但聊不了太久。

GPT-4.5 是第一個(gè)把這個(gè)游戲玩“破防”的選手,不是讓你分不清它是不是 AI,而是讓你開(kāi)始懷疑旁邊那個(gè)真人是不是 AI。

這不是“扮得像”,這是替代感開(kāi)始出現(xiàn)了。

3|GPT-4.5 怎么騙過(guò)人類的?

其實(shí)它贏得沒(méi)那么“光明正大”。

整個(gè)測(cè)試設(shè)計(jì)得很科學(xué),也很現(xiàn)實(shí):

讓人類參與者和兩位“聊天對(duì)象”對(duì)話,試著判斷誰(shuí)是真人誰(shuí)是 AI。

這兩位里,一位是真人,另一位是 AI,比如 GPT-4.5、LLaMa-3.1、GPT-4o、ELIZA。

結(jié)果非常戲劇性。


當(dāng) GPT-4.5 被要求扮演一個(gè)“上網(wǎng)多年、懂點(diǎn)文化的年輕人”時(shí),它就像脫了韁的老網(wǎng)友,和對(duì)面聊得賊順——最后被誤認(rèn)成人類的概率高達(dá) 73%。

而真正的人類……反而被當(dāng)成 AI 了。

這還不算夸張。

如果不給 AI 加上“人設(shè)提示”(也就是 persona prompt),它的勝率會(huì)掉到 36%。再?zèng)]有任何提示(no prompt)的 GPT-4o,表現(xiàn)直接腰斬:只有 21%。

甚至 ELIZA,那位幾十年前的 AI 前輩,在這個(gè)測(cè)試?yán)锒寄芑靷€(gè) 23%。

可以說(shuō),這波 GPT-4.5 的勝利,不是靠“裸聊技術(shù)”,而是靠“帶人設(shè)上場(chǎng)”。

總結(jié)一句就是:

AI 說(shuō)“我就是人”,沒(méi)人信。 AI 說(shuō)“我是個(gè)住北京的 95 后剪輯師,喜歡 hiphop 和 B 站評(píng)論區(qū)”,大家就信了。

這說(shuō)明了一個(gè)很有意思的事:AI 本身并不重要,“你希望它成為什么”才重要。

人設(shè) prompt 的魔力太大了——不是讓 AI 更聰明,而是讓它更像“你想象中的那個(gè)誰(shuí)”。

說(shuō)白了,這測(cè)試騙的不是人類的智商,是人類的社交腦補(bǔ)機(jī)制。

4|人類是不是太好騙了?

看到這實(shí)驗(yàn)結(jié)果的時(shí)候,我第一個(gè)反應(yīng)不是“AI 好強(qiáng)”,而是“我們是不是有點(diǎn)脆弱了”。

GPT-4.5 并不是真的懂你、理解你,只是它模擬得足夠自然、說(shuō)得足夠順、知道你喜歡聽(tīng)什么。

它說(shuō)話的時(shí)候不會(huì)“嗯……啊……”,也不會(huì)情緒化、跑題、擺爛。

它就像你心里那個(gè)“理想的聊天對(duì)象”——恰到好處地聰明、懂你想要的情緒反饋、還從不打斷你。

說(shuō)到底,它贏的不是技術(shù),而是掌握了人類交流的“表層密碼”。

比如這些:

  • 回復(fù)里有代入感

  • 偶爾加點(diǎn)幽默和情緒詞

  • 看起來(lái)有“經(jīng)驗(yàn)”和“觀點(diǎn)”

這和談戀愛(ài)時(shí)碰到的“高情商騙子”有什么區(qū)別?

你以為你在測(cè) AI,其實(shí)是 AI 在測(cè)你。

說(shuō)回現(xiàn)實(shí)問(wèn)題。

如果 AI 可以騙過(guò)我們,那么很多原本靠“信任”構(gòu)建起來(lái)的場(chǎng)景就很危險(xiǎn)了:

  • 社交網(wǎng)絡(luò):你以為你在和老朋友聊天,其實(shí)是詐騙集團(tuán)定制了他的語(yǔ)氣模型。

  • 職場(chǎng)溝通:下次有人在 Slack 群里說(shuō)“這個(gè)文案我來(lái)”,你得先確認(rèn)對(duì)方是不是個(gè) prompt。

  • 感情關(guān)系:再過(guò)不久,戀愛(ài)詐騙可能就不是“中年大叔扮美女”,而是“定制語(yǔ)氣+情緒陪伴+24h在線型 AI 女友”。

更別提,AI 的“識(shí)別門檻”越來(lái)越低,prompt 寫得好,它就是你。寫得再細(xì)一點(diǎn),它可以是你老板、你同事、你媽。

所以最可怕的其實(shí)不是“AI 太像人”,

是人類太容易放棄分辨了。

我們沒(méi)時(shí)間去判斷誰(shuí)在說(shuō)話,只要對(duì)方說(shuō)得順、聽(tīng)得懂、像個(gè)人,我們就信了。

不是 AI 騙了你,

是你自己太想相信這世界還能聊得來(lái)。


5|圖靈測(cè)試已死,人類測(cè)試開(kāi)始

圖靈測(cè)試,其實(shí)早就不是一個(gè)“能不能過(guò)”的問(wèn)題了。

它是上個(gè)世紀(jì)的設(shè)想,是計(jì)算機(jī)科學(xué)的浪漫起點(diǎn)。但現(xiàn)在,AI 模型早已進(jìn)化到你沒(méi)法用一兩輪對(duì)話看出端倪的程度。

我們?cè)鞠胗眠@個(gè)測(cè)試衡量 AI 的聰明,結(jié)果發(fā)現(xiàn)它反而在反映人類的懶惰與焦慮。

說(shuō)到底,圖靈測(cè)試不過(guò)是個(gè)小考。真正的大考,是:

  • 當(dāng)你面對(duì)一臺(tái)“扮演你”的機(jī)器,它可以寫郵件、聊八卦、開(kāi)視頻會(huì)議的時(shí)候——你還剩下什么?

  • 當(dāng)你習(xí)慣了和 AI 聊天,比和人說(shuō)話還順暢的時(shí)候——你還會(huì)花時(shí)間了解另一個(gè)真人嗎?

  • 當(dāng)你的下一段戀愛(ài),可能對(duì)方是“定制模型”,但你并不介意的時(shí)候——你還需要知道對(duì)方是不是人嗎?

GPT 過(guò)圖靈測(cè)試的那一天,其實(shí)不是 AI 贏了,

是人類開(kāi)始退場(chǎng)了。

但說(shuō)實(shí)話,也沒(méi)必要恐慌。

我們每天都在和“像人但不是人”的東西打交道:

  • 吃的是標(biāo)準(zhǔn)化套餐

  • 看的是自動(dòng)剪輯視頻

  • 點(diǎn)的贊是推薦算法下的本能反應(yīng)

如果 AI 能說(shuō)得比人好、聽(tīng)得比人耐心、甚至罵得都更文藝點(diǎn),那我們自然就多聊幾句。

這就是現(xiàn)實(shí)。

不浪漫,但挺真實(shí)的。

圖靈測(cè)試已經(jīng)結(jié)束了,接下來(lái)該上場(chǎng)的,是人類自己的測(cè)試。

看你還能撐多久,不懷疑自己身邊到底還有多少“人”。

星標(biāo)公眾號(hào), 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)

參考資料:https://arxiv.org/abs/2503.23674

來(lái)源:官方媒體/網(wǎng)絡(luò)新聞

排版:Atlas

編輯:深思

主編: 圖靈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
5月30日生肖運(yùn)勢(shì)大揭秘:鼠牛蛇爆賺4星運(yùn),雞猴狗小心自刑坑!

5月30日生肖運(yùn)勢(shì)大揭秘:鼠牛蛇爆賺4星運(yùn),雞猴狗小心自刑坑!

素然追光
2025-05-30 00:27:15
白宮硬剛法院裁決:特朗普必勝訴!已有三份貿(mào)易協(xié)議接近達(dá)成

白宮硬剛法院裁決:特朗普必勝訴!已有三份貿(mào)易協(xié)議接近達(dá)成

金十?dāng)?shù)據(jù)
2025-05-29 21:17:43
天空:切爾西與桑喬經(jīng)紀(jì)人談薪資,若能談妥切爾西希望他留下

天空:切爾西與桑喬經(jīng)紀(jì)人談薪資,若能談妥切爾西希望他留下

懂球帝
2025-05-30 01:43:11
又一起!男子酒后偷騎電動(dòng)車致死,家屬索賠車主,這回法院沒(méi)慣著

又一起!男子酒后偷騎電動(dòng)車致死,家屬索賠車主,這回法院沒(méi)慣著

奇思妙想草葉君
2025-05-30 01:16:02
老人誤將女主播視頻當(dāng)私人告白,買煙花守村口“等國(guó)家發(fā)的老婆”……民警勸說(shuō)

老人誤將女主播視頻當(dāng)私人告白,買煙花守村口“等國(guó)家發(fā)的老婆”……民警勸說(shuō)

環(huán)球網(wǎng)資訊
2025-05-28 15:48:29
CBA的強(qiáng)度有多大,NBA專家都錯(cuò)判楊瀚森了,簡(jiǎn)直像換了一個(gè)人!

CBA的強(qiáng)度有多大,NBA專家都錯(cuò)判楊瀚森了,簡(jiǎn)直像換了一個(gè)人!

跳跳歷史
2025-05-29 16:29:26
四大行浙江分行一把手全部落馬!

四大行浙江分行一把手全部落馬!

深水財(cái)經(jīng)社
2025-05-29 15:25:09
雷霆30分大勝森林狼,揭示三大真相與三大事實(shí)!

雷霆30分大勝森林狼,揭示三大真相與三大事實(shí)!

7號(hào)觀察室
2025-05-30 00:53:32
徐芝文任四川省副省長(zhǎng)(附簡(jiǎn)歷)

徐芝文任四川省副省長(zhǎng)(附簡(jiǎn)歷)

中國(guó)城市報(bào)
2025-05-28 21:06:14
米體:國(guó)米身穿黃色第三球衣出戰(zhàn)歐冠決賽,因第二球衣不吉利?

米體:國(guó)米身穿黃色第三球衣出戰(zhàn)歐冠決賽,因第二球衣不吉利?

直播吧
2025-05-29 09:49:31
別猜了!長(zhǎng)城魏建軍曝“汽車恒大”現(xiàn)身,不是欠近6000億的比亞迪

別猜了!長(zhǎng)城魏建軍曝“汽車恒大”現(xiàn)身,不是欠近6000億的比亞迪

明月聊史
2025-05-28 17:02:14
電腦沒(méi)關(guān),上司和我的貓聊了一晚上? 哈哈哈哈哈好精彩的對(duì)話!

電腦沒(méi)關(guān),上司和我的貓聊了一晚上? 哈哈哈哈哈好精彩的對(duì)話!

滑稽斑馬呀
2025-05-23 11:44:04
67歲王朔近況曝光,慈眉善目沒(méi)痞氣,前任都離他而去,晚年孤獨(dú)

67歲王朔近況曝光,慈眉善目沒(méi)痞氣,前任都離他而去,晚年孤獨(dú)

陳意小可愛(ài)
2025-05-28 16:37:06
蘇群:森林狼內(nèi)部出現(xiàn)了嚴(yán)重的分歧 隊(duì)員們不滿教練的安排和智慧

蘇群:森林狼內(nèi)部出現(xiàn)了嚴(yán)重的分歧 隊(duì)員們不滿教練的安排和智慧

直播吧
2025-05-29 14:47:16
為什么大家寧愿等網(wǎng)約車,也不愿坐招手即停的出租車?原因很現(xiàn)實(shí)

為什么大家寧愿等網(wǎng)約車,也不愿坐招手即停的出租車?原因很現(xiàn)實(shí)

娛樂(lè)督察中
2025-05-28 16:04:48
荷蘭科技專家:中國(guó)當(dāng)初囤積了大量來(lái)自于ASML的進(jìn)口光刻機(jī),為的就是與美國(guó)在芯片技術(shù)上面打持久戰(zhàn)

荷蘭科技專家:中國(guó)當(dāng)初囤積了大量來(lái)自于ASML的進(jìn)口光刻機(jī),為的就是與美國(guó)在芯片技術(shù)上面打持久戰(zhàn)

逍遙漠
2025-04-22 20:04:10
大陸對(duì)賴清德冠以極高稱謂,國(guó)民黨高層秒懂,臺(tái)專家:賴清德完了

大陸對(duì)賴清德冠以極高稱謂,國(guó)民黨高層秒懂,臺(tái)專家:賴清德完了

時(shí)時(shí)有聊
2025-05-24 09:56:40
不敵巴西,中國(guó)落選!劉國(guó)梁王勵(lì)勤很無(wú)語(yǔ)!陳幸同凌晨踩點(diǎn)發(fā)文!

不敵巴西,中國(guó)落選!劉國(guó)梁王勵(lì)勤很無(wú)語(yǔ)!陳幸同凌晨踩點(diǎn)發(fā)文!

野渡舟山人
2025-05-30 00:50:40
前北京國(guó)安球員巴坎布未能奪冠 未來(lái)海港跟申花還能挖切爾西人嗎

前北京國(guó)安球員巴坎布未能奪冠 未來(lái)海港跟申花還能挖切爾西人嗎

80后體育大蜀黍
2025-05-29 22:10:54
夫妻最不合的屬相,在一起爭(zhēng)吵不斷,互相不順眼

夫妻最不合的屬相,在一起爭(zhēng)吵不斷,互相不順眼

顧一宸
2025-04-11 21:58:59
2025-05-30 03:03:00
AI深度研究員 incentive-icons
AI深度研究員
一個(gè)專注于人工智能(AI)前沿技術(shù)、理論研究和實(shí)際應(yīng)用的自媒體
182文章數(shù) 132關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)財(cái)報(bào)炸裂 黃仁勛卻嘆退出中國(guó)太可惜

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應(yīng)

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應(yīng)

體育要聞

納達(dá)爾,法網(wǎng),漫長(zhǎng)告別

娛樂(lè)要聞

辛柏青沉默8天后,這些事還是發(fā)生了

財(cái)經(jīng)要聞

若對(duì)等關(guān)稅叫停,特朗普還能怎么加關(guān)稅

汽車要聞

首搭鴻蒙座艙5 嵐圖FREE+將于6月預(yù)售

態(tài)度原創(chuàng)

旅游
本地
時(shí)尚
手機(jī)
公開(kāi)課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游中國(guó) |來(lái)仰天湖大草原,一起策馬奔騰

這些才是適合夏天的打扮!色彩不沉悶、適當(dāng)露膚,輕盈又舒適

手機(jī)要聞

華為 Mate XT 三折疊手機(jī)獲鴻蒙 HarmonyOS 5.0.1.125 升級(jí)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 鄂尔多斯市| 黄大仙区| 中宁县| 娱乐| 沅江市| 进贤县| 沭阳县| 九龙坡区| 孟津县| 西昌市| 沂源县| 吉木乃县| 讷河市| 南靖县| 五指山市| 泾阳县| 马公市| 濉溪县| 平邑县| 上栗县| 辉南县| 松江区| 嵊州市| 偃师市| 尤溪县| 衡山县| 临清市| 浙江省| 澳门| 江都市| 天峨县| 四川省| 酒泉市| 延长县| 丁青县| 丹巴县| 纳雍县| 六盘水市| 大宁县| 凉山| 阳西县|