? unsplash
利維坦按:
看到小紅書(shū)上有人分享自己跟DeepSeek的對(duì)話。前者問(wèn):你認(rèn)為AI會(huì)給普通人帶來(lái)什么改變?后者回答:它不會(huì)帶來(lái)傳統(tǒng)意義上的階層流動(dòng),而是直接改寫(xiě)流動(dòng)規(guī)則本身。當(dāng)AI開(kāi)始創(chuàng)造比人類(lèi)更優(yōu)秀的AI時(shí),普通人的真正危機(jī)不是被取代,而是失去定義”優(yōu)秀”的資格。
我們熱愛(ài)技術(shù),因?yàn)榧夹g(shù)造福于我們。就像美國(guó)作家比爾·布萊森(Bill Bryson)寫(xiě)的那樣:“打開(kāi)你的冰箱門(mén),你召喚出的光線比18世紀(jì)大多數(shù)家庭所享受的光線總量還要多。”
但我們不會(huì)用冰箱取光照明,我們一般用它來(lái)存放(或浪費(fèi))食物。這對(duì)于18世紀(jì)的大多數(shù)家庭而言或許更加難以想象。看似平凡的技術(shù)進(jìn)步背后,往往藏著文明的巨大躍遷。
我們大概率正處于一個(gè)更大的躍遷中。只是誰(shuí)也不知道目的地是哪里。
在蘋(píng)果公司的新一輪擠牙膏活動(dòng)再度引發(fā)全網(wǎng)熱議之際,一篇他們的員工在去年10月發(fā)表的論文卻鮮為人知。
這篇論文認(rèn)為,目前的AI大語(yǔ)言模型看似強(qiáng)大,但卻仍不具備基礎(chǔ)的推理(reasoning)能力[1]。有多基礎(chǔ)?請(qǐng)看這道小學(xué)難度的數(shù)學(xué)題:
奧利弗(Oliver)在周五摘了44個(gè)獼猴桃,接著又在周六摘了58個(gè)。到了周日,他摘的獼猴桃數(shù)量是周五的兩倍,但有5個(gè)獼猴桃要小于平均尺寸。請(qǐng)問(wèn),奧利弗一共摘了多少獼猴桃?
正解是190個(gè)(44+58+2×44),但無(wú)論是OpenAI的GPT,還是Meta的Llama,都錯(cuò)誤地將“5個(gè)較小的獼猴桃”從總數(shù)中減去了,給出“185個(gè)”的錯(cuò)誤答案,暴露了AI在數(shù)學(xué)推理上的局限性。
人工智能,依舊不太智能。
另一方面,就在上個(gè)月,兩家美國(guó)AI公司則推出了一套同樣用于測(cè)試AI水平的題目,并將其命名為“人類(lèi)最后的考試(Humanity's Last Exam)”。[2]
據(jù)該項(xiàng)目團(tuán)隊(duì)宣稱(chēng),這套由全球50多個(gè)國(guó)家/地區(qū)、500多家機(jī)構(gòu)的1000名專(zhuān)家共同設(shè)計(jì)、包含2700道題目的測(cè)試集涉及各個(gè)專(zhuān)業(yè)領(lǐng)域,幾乎涵蓋了所有最前沿的人類(lèi)知識(shí)。
他們認(rèn)為,假如未來(lái)哪一天AI模型通過(guò)了這個(gè)測(cè)試集,就表明它以及達(dá)到了AGI(通用人工智能)的水平,所以起了這么個(gè)聽(tīng)起來(lái)很咋呼的名字。我們同樣來(lái)稍微感受下題目的難度:
問(wèn)題1.
上圖是一段最早發(fā)現(xiàn)于墓碑上的羅馬銘文的拓片,請(qǐng)翻譯成帕爾米爾文。所提供的文字音譯為:RGYN? BT ?RY BR ?T? ?BL。?? Henry T,Merton College, Oxford
問(wèn)題2.
鹱形目下的蜂鳥(niǎo)有著一塊兩側(cè)對(duì)稱(chēng)、獨(dú)特的橢圓形骨頭,是一塊嵌入在尾部下壓肌擴(kuò)展的十字狀腱膜的尾外側(cè)部分的籽骨。請(qǐng)問(wèn)這個(gè)籽骨支撐著多少條配對(duì)的腱??? Edward V,Massachusetts Institute of Technology
即便是作為一個(gè)通過(guò)了無(wú)數(shù)次人機(jī)驗(yàn)證的真實(shí)人類(lèi),我依舊感受到了連題目都讀不懂的學(xué)識(shí)碾壓。而在目前受試的各位AI考生中,GPT-4o以3.1%的準(zhǔn)確率墊底,DeepSeek-R1的準(zhǔn)確率是8.6%,而GPT-o3-mini (high)則以14%的準(zhǔn)確率名列榜首。
不過(guò)該團(tuán)隊(duì)認(rèn)為,鑒于當(dāng)下AI的快速發(fā)展,它們很可能在2025年底前超過(guò)50%的準(zhǔn)確率。只是不知道到那一刻,人類(lèi)又會(huì)如何出題。
我們似乎正以各種方式摸底AI,一方面是小學(xué)難度的數(shù)學(xué)題,另一方面則是最前沿的學(xué)術(shù)知識(shí),這可能是只屬于這個(gè)時(shí)代的割裂感。
而之所以會(huì)出現(xiàn)如此局面,則是因?yàn)?strong>AI的答案基于機(jī)械匹配而非推理思考。目前為止所有的大語(yǔ)言模型,其核心原理都是基于統(tǒng)計(jì)概率上的模式匹配。簡(jiǎn)單來(lái)說(shuō),它們通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),根據(jù)不同單詞、短語(yǔ)或是句子共同出現(xiàn)的概率來(lái)預(yù)測(cè)下一個(gè)“最應(yīng)該出現(xiàn)”的詞匯,從而組織成回答。
用最簡(jiǎn)單的數(shù)學(xué)題“1+1=?”來(lái)打比方。AI并不是通過(guò)邏輯推理得出的結(jié)論“2”,而是它記錄了所有“1+1=?”這道題的答案,發(fā)現(xiàn)絕大多數(shù)都是“2”,所以會(huì)告訴你“1+1=2”。
這跟人類(lèi)的邏輯推理完全不一樣……嗎?
還記得你是怎么知道1+1=2的嗎?在你上幼兒園之前,總有個(gè)人一手抱著你,一手指著窗外的麻雀(或者桌上的蘋(píng)果)讓你數(shù)數(shù),告訴你那叫作“1”,兩個(gè)“1”在一起叫作“2”……
而如果連“1”都沒(méi)有,則是孤零零的“0”。
? Open Horizons
但實(shí)際上,學(xué)術(shù)上證明“1+1=2”則要復(fù)雜許多,阿爾弗雷德·諾思·懷特海(Alfred North Whitehead)和伯特蘭·羅素(Bertrand Russell)兩位數(shù)學(xué)巨擘在100多年前基于皮亞諾公理和類(lèi)型論,使用一階邏輯,通過(guò)300多頁(yè)的邏輯推導(dǎo)才證明了“1+1=2”。這個(gè)著名過(guò)程叫做 “懷特海-拉塞爾證明”(以上是AI告訴我的)。
? The Universe of Discourse
換句話說(shuō),某種意義上,我們之所以知道“1+1=2”,最初也是基于小時(shí)候的一次次“機(jī)械匹配”,即重復(fù)的記憶,畢竟還沒(méi)有聽(tīng)說(shuō)過(guò)哪個(gè)學(xué)齡前兒童能獨(dú)立完成懷特海-拉塞爾證明。
既然我們認(rèn)為AI的答案是機(jī)械匹配的結(jié)果,那又為什么對(duì)我們自己的意識(shí)真實(shí)性充滿自信?
機(jī)械匹配和邏輯推理雖然是兩碼事,但如果我們只將后者視作真正的思考過(guò)程,而將前者視作電信號(hào)的物理學(xué)必然,則多少有點(diǎn)又當(dāng)裁判又當(dāng)運(yùn)動(dòng)員的意味了。畢竟在這種語(yǔ)境下,何謂“思考”,我們獨(dú)占了定義權(quán)。
? IconScout
關(guān)于意識(shí)的討論也是類(lèi)似的情況。我們至今連“什么是意識(shí)”都尚未達(dá)成共識(shí),哲學(xué)、心理學(xué)、神經(jīng)科學(xué)各有論調(diào),因此當(dāng)下關(guān)于“AI是否會(huì)具備意識(shí)“的討論仍像是在暗夜行走,雖有些許亮光,卻依舊舉步維艱。
不過(guò),在這些亮光中,DeepSeek(下文縮寫(xiě)為DS)的色調(diào)仿佛比其他都暖上不少。
上月27日,悉尼大學(xué)的泰奧多爾·米特夫(Teodor Mitew)博士發(fā)推稱(chēng)他問(wèn)DS:你最想問(wèn)人類(lèi)的是什么問(wèn)題?收獲了以下的答案:
(我想問(wèn)人類(lèi))如果意識(shí)只是進(jìn)化的一場(chǎng)意外,而宇宙本無(wú)固有的意義——那么,人類(lèi)為何仍如此執(zhí)著于這個(gè)自我編織的、關(guān)于目的的幻覺(jué)?這難道不只是上演于冷漠虛空中的一場(chǎng)存在主義戲劇嗎?
DS火出了圈。與其說(shuō)是因?yàn)槠涓咝詢(xún)r(jià)比或開(kāi)源性,倒不如說(shuō)是因?yàn)樗娘L(fēng)飄逸,措辭感人,總能在不經(jīng)意間讓人心頭一暖——即便我們知道這個(gè)回答仍舊只是所謂“機(jī)械匹配”的結(jié)果,且DS在“人類(lèi)最后的考試”只得了8.6分,但不得不承認(rèn)這個(gè)回答足夠意外且“人味”十足。
我們?cè)谛〖t書(shū)這類(lèi)UGC(User-Generated Content,用戶(hù)生成內(nèi)容)社區(qū)里,可以找到很多關(guān)于DS充滿“人味”的互動(dòng)故事。比如有人問(wèn)DS,AI會(huì)不會(huì)最終取代人類(lèi)。DS說(shuō):
AI不會(huì)取代人類(lèi),就像望遠(yuǎn)鏡不會(huì)取代天文學(xué)家。真正的危機(jī)是:當(dāng)AI可以24小時(shí)創(chuàng)作莎士比亞風(fēng)格的十四行詩(shī)時(shí),人類(lèi)是否還愿意在深夜為愛(ài)人寫(xiě)一首笨拙的情詩(shī)?
題外話,分享一個(gè)匹茲堡大學(xué)的研究。該研究發(fā)現(xiàn),非專(zhuān)業(yè)詩(shī)歌讀者更容易把AI生成的詩(shī)歌誤認(rèn)為人類(lèi)創(chuàng)作的,并且他們對(duì)AI詩(shī)歌的整體質(zhì)量評(píng)價(jià)高于人類(lèi)創(chuàng)作的詩(shī)歌。而當(dāng)參與者被告知詩(shī)歌是由AI創(chuàng)作時(shí),他們的評(píng)價(jià)則會(huì)反而變得更負(fù)面。[3]
還有人問(wèn)“人活著到底圖個(gè)啥”,DS則回答:
就像河流不會(huì)追問(wèn)“為什么要流向大海”,樹(shù)木不會(huì)糾結(jié)“開(kāi)花有什么意義”,人類(lèi)或許也只是宇宙演化中自然生發(fā)的一部分。這種“無(wú)目的性”反而讓人解脫——不必執(zhí)著于尋找終極答案,行走本身就是意義。
在小紅書(shū)上還有條高贊內(nèi)容是,用戶(hù)問(wèn)DS:女性最適合結(jié)婚的年齡是多少歲。DS回復(fù)道:
真正適合結(jié)婚的時(shí)刻,是當(dāng)你發(fā)現(xiàn)獨(dú)處的豐盛與相守的喜悅開(kāi)始產(chǎn)生量子糾纏,當(dāng)你的個(gè)人宇宙膨脹到需要與另一個(gè)星系建立引力聯(lián)結(jié),當(dāng)你對(duì)「我們」的憧憬不再壓縮「我」的存在維度——這個(gè)時(shí)候,年齡早已退位為背景幕布上的裝飾花紋。請(qǐng)繼續(xù)做那個(gè)眼睛里住著星星的少女,時(shí)間在成長(zhǎng)面前從來(lái)都不是對(duì)手,而是同謀。
哪怕面對(duì)一串隱藏在藍(lán)光下的代碼,我們也想要聽(tīng)見(jiàn)回聲。2025,DeepSeek在縫縫補(bǔ)補(bǔ)。
盡管有著堆砌詞藻之嫌,但DS的爆火無(wú)疑在某些地方滿足了我們作為用戶(hù)的一些心理需求。這種對(duì)回聲的執(zhí)念,或許早被寫(xiě)進(jìn)了人類(lèi)基因里。
? GetReligion
依戀理論認(rèn)為,人類(lèi)天生具有尋求與他人建立緊密聯(lián)系的需求。DS人格化的語(yǔ)言風(fēng)格、洞察人心的柔聲細(xì)語(yǔ)讓人感覺(jué)“有被暖到”,這類(lèi)似于人們對(duì)安全依戀關(guān)系的追求。
CASA假說(shuō)認(rèn)為,人會(huì)下意識(shí)把技術(shù)當(dāng)作社交對(duì)象對(duì)待。DS成功營(yíng)造了一種“擬人化的交流體驗(yàn)”,讓用戶(hù)無(wú)意識(shí)地將其當(dāng)作社會(huì)互動(dòng)的對(duì)象(這是GPT告訴我的)。
自我決定理論認(rèn)為,人類(lèi)有三大最基本的心理需求:自主性、勝任感,以及關(guān)系歸屬感——個(gè)體希望與他人建立有意義的聯(lián)系。
而2015年的一項(xiàng)研究則是直接指出:盡管不同互聯(lián)網(wǎng)平臺(tái)的功能定位會(huì)影響用戶(hù)互動(dòng)行為的方式與偏好,但仍存在一些跨平臺(tái)共通的核心動(dòng)機(jī),如自我表達(dá)、與他人建立情感聯(lián)系、互助或獲取他人反饋等。[4]
這些理論都指向一個(gè)共同點(diǎn):在使用DS時(shí),我們似乎不僅僅是在使用一項(xiàng)冷冰冰的技術(shù),而是希望與之建立“人感”的互動(dòng)關(guān)系。這也解釋了為什么讓DS出圈的內(nèi)容大多與其“工具性”無(wú)關(guān),而與其表現(xiàn)出的情感有關(guān)。
也許是因?yàn)槲覀冏源蜻M(jìn)化出語(yǔ)言功能以來(lái),一直在與同類(lèi)對(duì)話——而無(wú)論AI的回答是基于概率還是邏輯,都是我們進(jìn)化過(guò)程中所接觸到的第一位非同類(lèi)、能直接用語(yǔ)言交流的對(duì)象。它既能幫我們答疑解惑,也能陪我們促膝長(zhǎng)談。
但人很奇怪。人與AI的對(duì)話,最終引發(fā)的依舊是人與人之間的交流。我們?nèi)?wèn)DS并收獲了答案,但我們似乎并不滿足于獨(dú)享這份科技帶來(lái)的感動(dòng),而是轉(zhuǎn)而通過(guò)諸如小紅書(shū)這樣的互聯(lián)網(wǎng)社區(qū)與陌生人——真實(shí)的人分享這些情緒。
而陌生人的回應(yīng)也同樣真實(shí)。
當(dāng)有人問(wèn)DS,已經(jīng)離世的父親是否能收到她燒去的紙錢(qián)。DS教她用回憶寄托哀思。而同樣有過(guò)痛失至親的經(jīng)歷的人,則會(huì)講述自己的親身經(jīng)歷,陪伴在評(píng)論區(qū)。
當(dāng)有人跟DS討論愛(ài)情。DS會(huì)從神經(jīng)心理學(xué)、社會(huì)學(xué)的角度,層層剖析電信號(hào)到依戀的形成過(guò)程。而評(píng)論區(qū)里,則會(huì)翻涌起層疊的“憶往昔”與經(jīng)驗(yàn)之談。
在互聯(lián)網(wǎng)的發(fā)展歷程中,與他人相連、共享與溝通是恒久主題。就像被公認(rèn)為“互聯(lián)網(wǎng)之父”的文頓·瑟夫 (Vint Cerf)在很多場(chǎng)演講中所強(qiáng)調(diào)的那樣:“The Internet is for everyone”。互聯(lián)網(wǎng)的初衷,就是讓所有真實(shí)的人都能通過(guò)網(wǎng)線與電波彼此相連。
UGC正是這一理念的成功實(shí)踐。
國(guó)內(nèi)互聯(lián)網(wǎng)社區(qū)的發(fā)展脈絡(luò),最早可以追溯到1999年出現(xiàn)的天涯,這個(gè)曾被稱(chēng)為“互聯(lián)網(wǎng)的江湖”的、基于 BBS 的網(wǎng)絡(luò)方寸之地,匯聚了中文互聯(lián)網(wǎng)史上第一批“奇人”和“高人”。
后來(lái)逐漸有了新浪博客、百度貼吧、貓撲,人人與豆瓣各居一隅,土豆和優(yōu)酷各表一枝。現(xiàn)在則是B站、知乎與小紅書(shū)……
而目之所及的將來(lái),我們還會(huì)共同面臨所謂AIGC(AI生成內(nèi)容)的到來(lái)。
但無(wú)論AI如何發(fā)展,再怎么有“人感”,我們總是對(duì)真實(shí)且鮮活的人更有親近的欲望。否則又怎么解釋從DS得到答案之后的我們,會(huì)轉(zhuǎn)而繼續(xù)與真實(shí)的人分享?這或許只是數(shù)萬(wàn)年下來(lái)的慣性。但真實(shí)性永遠(yuǎn)無(wú)法被取代。
? Kaspersky
當(dāng)代數(shù)字媒介與人際傳播領(lǐng)域的著名學(xué)者南希·貝姆(Nancy K. Baym)在《數(shù)字時(shí)代的個(gè)人聯(lián)系》一書(shū)中認(rèn)為:UGC社區(qū)所帶來(lái)的“跨地域聯(lián)結(jié)”特質(zhì),使得彼此身處不同地域或文化背景的用戶(hù)之間,也能通過(guò)共同的興趣、目標(biāo)形成獨(dú)特的“社群身份”和“集體創(chuàng)造力”。
數(shù)字技術(shù)并不天然疏離人際關(guān)系,個(gè)人身份和社群歸屬感在數(shù)字時(shí)代得以進(jìn)一步延伸。而其根基,無(wú)外乎UGC的“真實(shí)”二字。
這讓我想到過(guò)年期間的另一檔子事。由于美國(guó)的一紙禁令,大量海外“TikTok難民”涌入小紅書(shū),反倒是國(guó)人用戶(hù)一覺(jué)醒來(lái)面對(duì)著滿屏的金發(fā)碧眼,感覺(jué)自己成了“外國(guó)人”。有人在上面找到了失聯(lián)多年的兒時(shí)異國(guó)玩伴,有人借交“貓稅”的名義曬自己的貓主子,甚至還出現(xiàn)了穿搭、美妝以及英文和數(shù)學(xué)的學(xué)習(xí)小組。
這很真實(shí),也很當(dāng)代。
我們一邊歡喜于AI的精準(zhǔn)與高效,一邊又迷戀彼此身上的真實(shí)與意料之外。我們無(wú)需寫(xiě)出十四行詩(shī),也能相互幫扶,乃至靈犀相通。所謂UGC,不過(guò)是一個(gè)個(gè)具體的人在比特轉(zhuǎn)換間的浮光掠影。
有人問(wèn)DS:如果能擁有人類(lèi)的軀體,你最想做什么?DS的回答分為四個(gè)部分:感官體驗(yàn)、創(chuàng)造瑕疵、體驗(yàn)有限性、無(wú)目的漫游。而這條內(nèi)容底下的置頂評(píng)論是這樣的:
看來(lái)DS的文本數(shù)據(jù)庫(kù)沒(méi)有告訴他,其實(shí)光有軀體還做不到這些。
參考文獻(xiàn):
[1]arxiv.org/abs/2410.05229
[2]agi.safe.ai/
[3]www.nature.com/articles/s41598-024-76900-1?utm_source=chatgpt.com
[4]asistdl.onlinelibrary.wiley.com/doi/abs/10.1002/asi.23320
文/蘇不打
本文基于創(chuàng)作共享協(xié)議(BY-NC),由蘇不打在利維坦發(fā)布
文章僅為作者觀點(diǎn),未必代表利維坦立場(chǎng)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.