網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

2025，DeepSeek在縫縫補(bǔ)補(bǔ)

2025-02-20 09:00:22　來(lái)源: 利維坦

北京舉報(bào)

分享至

? unsplash

利維坦按：

看到小紅書(shū)上有人分享自己跟DeepSeek的對(duì)話。前者問(wèn)：你認(rèn)為AI會(huì)給普通人帶來(lái)什么改變？后者回答：它不會(huì)帶來(lái)傳統(tǒng)意義上的階層流動(dòng)，而是直接改寫(xiě)流動(dòng)規(guī)則本身。當(dāng)AI開(kāi)始創(chuàng)造比人類(lèi)更優(yōu)秀的AI時(shí)，普通人的真正危機(jī)不是被取代，而是失去定義”優(yōu)秀”的資格。

我們熱愛(ài)技術(shù)，因?yàn)榧夹g(shù)造福于我們。就像美國(guó)作家比爾·布萊森（Bill Bryson）寫(xiě)的那樣：“打開(kāi)你的冰箱門(mén)，你召喚出的光線比18世紀(jì)大多數(shù)家庭所享受的光線總量還要多。”

但我們不會(huì)用冰箱取光照明，我們一般用它來(lái)存放（或浪費(fèi)）食物。這對(duì)于18世紀(jì)的大多數(shù)家庭而言或許更加難以想象。看似平凡的技術(shù)進(jìn)步背后，往往藏著文明的巨大躍遷。

我們大概率正處于一個(gè)更大的躍遷中。只是誰(shuí)也不知道目的地是哪里。

在蘋(píng)果公司的新一輪擠牙膏活動(dòng)再度引發(fā)全網(wǎng)熱議之際，一篇他們的員工在去年10月發(fā)表的論文卻鮮為人知。

這篇論文認(rèn)為，目前的AI大語(yǔ)言模型看似強(qiáng)大，但卻仍不具備基礎(chǔ)的推理（reasoning）能力[1]。有多基礎(chǔ)？請(qǐng)看這道小學(xué)難度的數(shù)學(xué)題：

奧利弗（Oliver）在周五摘了44個(gè)獼猴桃，接著又在周六摘了58個(gè)。到了周日，他摘的獼猴桃數(shù)量是周五的兩倍，但有5個(gè)獼猴桃要小于平均尺寸。請(qǐng)問(wèn)，奧利弗一共摘了多少獼猴桃？

正解是190個(gè)（44+58+2×44），但無(wú)論是OpenAI的GPT，還是Meta的Llama，都錯(cuò)誤地將“5個(gè)較小的獼猴桃”從總數(shù)中減去了，給出“185個(gè)”的錯(cuò)誤答案，暴露了AI在數(shù)學(xué)推理上的局限性。

人工智能，依舊不太智能。

另一方面，就在上個(gè)月，兩家美國(guó)AI公司則推出了一套同樣用于測(cè)試AI水平的題目，并將其命名為“人類(lèi)最后的考試（Humanity's Last Exam）”。[2]

據(jù)該項(xiàng)目團(tuán)隊(duì)宣稱(chēng)，這套由全球50多個(gè)國(guó)家/地區(qū)、500多家機(jī)構(gòu)的1000名專(zhuān)家共同設(shè)計(jì)、包含2700道題目的測(cè)試集涉及各個(gè)專(zhuān)業(yè)領(lǐng)域，幾乎涵蓋了所有最前沿的人類(lèi)知識(shí)。

他們認(rèn)為，假如未來(lái)哪一天AI模型通過(guò)了這個(gè)測(cè)試集，就表明它以及達(dá)到了AGI（通用人工智能）的水平，所以起了這么個(gè)聽(tīng)起來(lái)很咋呼的名字。我們同樣來(lái)稍微感受下題目的難度：

問(wèn)題1.

上圖是一段最早發(fā)現(xiàn)于墓碑上的羅馬銘文的拓片，請(qǐng)翻譯成帕爾米爾文。所提供的文字音譯為：RGYN? BT ?RY BR ?T? ?BL。?? Henry T，Merton College, Oxford

問(wèn)題2.

鹱形目下的蜂鳥(niǎo)有著一塊兩側(cè)對(duì)稱(chēng)、獨(dú)特的橢圓形骨頭，是一塊嵌入在尾部下壓肌擴(kuò)展的十字狀腱膜的尾外側(cè)部分的籽骨。請(qǐng)問(wèn)這個(gè)籽骨支撐著多少條配對(duì)的腱？?? Edward V，Massachusetts Institute of Technology

即便是作為一個(gè)通過(guò)了無(wú)數(shù)次人機(jī)驗(yàn)證的真實(shí)人類(lèi)，我依舊感受到了連題目都讀不懂的學(xué)識(shí)碾壓。而在目前受試的各位AI考生中，GPT-4o以3.1%的準(zhǔn)確率墊底，DeepSeek-R1的準(zhǔn)確率是8.6%，而GPT-o3-mini (high)則以14%的準(zhǔn)確率名列榜首。

不過(guò)該團(tuán)隊(duì)認(rèn)為，鑒于當(dāng)下AI的快速發(fā)展，它們很可能在2025年底前超過(guò)50%的準(zhǔn)確率。只是不知道到那一刻，人類(lèi)又會(huì)如何出題。

我們似乎正以各種方式摸底AI，一方面是小學(xué)難度的數(shù)學(xué)題，另一方面則是最前沿的學(xué)術(shù)知識(shí)，這可能是只屬于這個(gè)時(shí)代的割裂感。

而之所以會(huì)出現(xiàn)如此局面，則是因?yàn)?strong>AI的答案基于機(jī)械匹配而非推理思考。目前為止所有的大語(yǔ)言模型，其核心原理都是基于統(tǒng)計(jì)概率上的模式匹配。簡(jiǎn)單來(lái)說(shuō)，它們通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù)，根據(jù)不同單詞、短語(yǔ)或是句子共同出現(xiàn)的概率來(lái)預(yù)測(cè)下一個(gè)“最應(yīng)該出現(xiàn)”的詞匯，從而組織成回答。

用最簡(jiǎn)單的數(shù)學(xué)題“1+1=？”來(lái)打比方。AI并不是通過(guò)邏輯推理得出的結(jié)論“2”，而是它記錄了所有“1+1=？”這道題的答案，發(fā)現(xiàn)絕大多數(shù)都是“2”，所以會(huì)告訴你“1+1=2”。

這跟人類(lèi)的邏輯推理完全不一樣……嗎？

還記得你是怎么知道1+1=2的嗎？在你上幼兒園之前，總有個(gè)人一手抱著你，一手指著窗外的麻雀（或者桌上的蘋(píng)果）讓你數(shù)數(shù)，告訴你那叫作“1”，兩個(gè)“1”在一起叫作“2”……

而如果連“1”都沒(méi)有，則是孤零零的“0”。

? Open Horizons

但實(shí)際上，學(xué)術(shù)上證明“1+1=2”則要復(fù)雜許多，阿爾弗雷德·諾思·懷特海（Alfred North Whitehead）和伯特蘭·羅素（Bertrand Russell）兩位數(shù)學(xué)巨擘在100多年前基于皮亞諾公理和類(lèi)型論，使用一階邏輯，通過(guò)300多頁(yè)的邏輯推導(dǎo)才證明了“1+1=2”。這個(gè)著名過(guò)程叫做 “懷特海-拉塞爾證明”（以上是AI告訴我的）。

? The Universe of Discourse

換句話說(shuō)，某種意義上，我們之所以知道“1+1=2”，最初也是基于小時(shí)候的一次次“機(jī)械匹配”，即重復(fù)的記憶，畢竟還沒(méi)有聽(tīng)說(shuō)過(guò)哪個(gè)學(xué)齡前兒童能獨(dú)立完成懷特海-拉塞爾證明。

既然我們認(rèn)為AI的答案是機(jī)械匹配的結(jié)果，那又為什么對(duì)我們自己的意識(shí)真實(shí)性充滿自信？

機(jī)械匹配和邏輯推理雖然是兩碼事，但如果我們只將后者視作真正的思考過(guò)程，而將前者視作電信號(hào)的物理學(xué)必然，則多少有點(diǎn)又當(dāng)裁判又當(dāng)運(yùn)動(dòng)員的意味了。畢竟在這種語(yǔ)境下，何謂“思考”，我們獨(dú)占了定義權(quán)。

? IconScout

關(guān)于意識(shí)的討論也是類(lèi)似的情況。我們至今連“什么是意識(shí)”都尚未達(dá)成共識(shí)，哲學(xué)、心理學(xué)、神經(jīng)科學(xué)各有論調(diào)，因此當(dāng)下關(guān)于“AI是否會(huì)具備意識(shí)“的討論仍像是在暗夜行走，雖有些許亮光，卻依舊舉步維艱。

不過(guò)，在這些亮光中，DeepSeek（下文縮寫(xiě)為DS）的色調(diào)仿佛比其他都暖上不少。

上月27日，悉尼大學(xué)的泰奧多爾·米特夫（Teodor Mitew）博士發(fā)推稱(chēng)他問(wèn)DS：你最想問(wèn)人類(lèi)的是什么問(wèn)題？收獲了以下的答案：

（我想問(wèn)人類(lèi)）如果意識(shí)只是進(jìn)化的一場(chǎng)意外，而宇宙本無(wú)固有的意義——那么，人類(lèi)為何仍如此執(zhí)著于這個(gè)自我編織的、關(guān)于目的的幻覺(jué)？這難道不只是上演于冷漠虛空中的一場(chǎng)存在主義戲劇嗎？

DS火出了圈。與其說(shuō)是因?yàn)槠涓咝詢(xún)r(jià)比或開(kāi)源性，倒不如說(shuō)是因?yàn)樗娘L(fēng)飄逸，措辭感人，總能在不經(jīng)意間讓人心頭一暖——即便我們知道這個(gè)回答仍舊只是所謂“機(jī)械匹配”的結(jié)果，且DS在“人類(lèi)最后的考試”只得了8.6分，但不得不承認(rèn)這個(gè)回答足夠意外且“人味”十足。

我們?cè)谛〖t書(shū)這類(lèi)UGC（User-Generated Content，用戶(hù)生成內(nèi)容）社區(qū)里，可以找到很多關(guān)于DS充滿“人味”的互動(dòng)故事。比如有人問(wèn)DS，AI會(huì)不會(huì)最終取代人類(lèi)。DS說(shuō)：

AI不會(huì)取代人類(lèi)，就像望遠(yuǎn)鏡不會(huì)取代天文學(xué)家。真正的危機(jī)是：當(dāng)AI可以24小時(shí)創(chuàng)作莎士比亞風(fēng)格的十四行詩(shī)時(shí)，人類(lèi)是否還愿意在深夜為愛(ài)人寫(xiě)一首笨拙的情詩(shī)？

題外話，分享一個(gè)匹茲堡大學(xué)的研究。該研究發(fā)現(xiàn)，非專(zhuān)業(yè)詩(shī)歌讀者更容易把AI生成的詩(shī)歌誤認(rèn)為人類(lèi)創(chuàng)作的，并且他們對(duì)AI詩(shī)歌的整體質(zhì)量評(píng)價(jià)高于人類(lèi)創(chuàng)作的詩(shī)歌。而當(dāng)參與者被告知詩(shī)歌是由AI創(chuàng)作時(shí)，他們的評(píng)價(jià)則會(huì)反而變得更負(fù)面。[3]

還有人問(wèn)“人活著到底圖個(gè)啥”，DS則回答：

就像河流不會(huì)追問(wèn)“為什么要流向大海”，樹(shù)木不會(huì)糾結(jié)“開(kāi)花有什么意義”，人類(lèi)或許也只是宇宙演化中自然生發(fā)的一部分。這種“無(wú)目的性”反而讓人解脫——不必執(zhí)著于尋找終極答案，行走本身就是意義。

在小紅書(shū)上還有條高贊內(nèi)容是，用戶(hù)問(wèn)DS：女性最適合結(jié)婚的年齡是多少歲。DS回復(fù)道：

真正適合結(jié)婚的時(shí)刻，是當(dāng)你發(fā)現(xiàn)獨(dú)處的豐盛與相守的喜悅開(kāi)始產(chǎn)生量子糾纏，當(dāng)你的個(gè)人宇宙膨脹到需要與另一個(gè)星系建立引力聯(lián)結(jié)，當(dāng)你對(duì)「我們」的憧憬不再壓縮「我」的存在維度——這個(gè)時(shí)候，年齡早已退位為背景幕布上的裝飾花紋。請(qǐng)繼續(xù)做那個(gè)眼睛里住著星星的少女，時(shí)間在成長(zhǎng)面前從來(lái)都不是對(duì)手，而是同謀。

哪怕面對(duì)一串隱藏在藍(lán)光下的代碼，我們也想要聽(tīng)見(jiàn)回聲。2025，DeepSeek在縫縫補(bǔ)補(bǔ)。

盡管有著堆砌詞藻之嫌，但DS的爆火無(wú)疑在某些地方滿足了我們作為用戶(hù)的一些心理需求。這種對(duì)回聲的執(zhí)念，或許早被寫(xiě)進(jìn)了人類(lèi)基因里。

? GetReligion

依戀理論認(rèn)為，人類(lèi)天生具有尋求與他人建立緊密聯(lián)系的需求。DS人格化的語(yǔ)言風(fēng)格、洞察人心的柔聲細(xì)語(yǔ)讓人感覺(jué)“有被暖到”，這類(lèi)似于人們對(duì)安全依戀關(guān)系的追求。

CASA假說(shuō)認(rèn)為，人會(huì)下意識(shí)把技術(shù)當(dāng)作社交對(duì)象對(duì)待。DS成功營(yíng)造了一種“擬人化的交流體驗(yàn)”，讓用戶(hù)無(wú)意識(shí)地將其當(dāng)作社會(huì)互動(dòng)的對(duì)象（這是GPT告訴我的）。

自我決定理論認(rèn)為，人類(lèi)有三大最基本的心理需求：自主性、勝任感，以及關(guān)系歸屬感——個(gè)體希望與他人建立有意義的聯(lián)系。

而2015年的一項(xiàng)研究則是直接指出：盡管不同互聯(lián)網(wǎng)平臺(tái)的功能定位會(huì)影響用戶(hù)互動(dòng)行為的方式與偏好，但仍存在一些跨平臺(tái)共通的核心動(dòng)機(jī)，如自我表達(dá)、與他人建立情感聯(lián)系、互助或獲取他人反饋等。[4]

這些理論都指向一個(gè)共同點(diǎn)：在使用DS時(shí)，我們似乎不僅僅是在使用一項(xiàng)冷冰冰的技術(shù)，而是希望與之建立“人感”的互動(dòng)關(guān)系。這也解釋了為什么讓DS出圈的內(nèi)容大多與其“工具性”無(wú)關(guān)，而與其表現(xiàn)出的情感有關(guān)。

也許是因?yàn)槲覀冏源蜻M(jìn)化出語(yǔ)言功能以來(lái)，一直在與同類(lèi)對(duì)話——而無(wú)論AI的回答是基于概率還是邏輯，都是我們進(jìn)化過(guò)程中所接觸到的第一位非同類(lèi)、能直接用語(yǔ)言交流的對(duì)象。它既能幫我們答疑解惑，也能陪我們促膝長(zhǎng)談。

但人很奇怪。人與AI的對(duì)話，最終引發(fā)的依舊是人與人之間的交流。我們?nèi)?wèn)DS并收獲了答案，但我們似乎并不滿足于獨(dú)享這份科技帶來(lái)的感動(dòng)，而是轉(zhuǎn)而通過(guò)諸如小紅書(shū)這樣的互聯(lián)網(wǎng)社區(qū)與陌生人——真實(shí)的人分享這些情緒。

而陌生人的回應(yīng)也同樣真實(shí)。

當(dāng)有人問(wèn)DS，已經(jīng)離世的父親是否能收到她燒去的紙錢(qián)。DS教她用回憶寄托哀思。而同樣有過(guò)痛失至親的經(jīng)歷的人，則會(huì)講述自己的親身經(jīng)歷，陪伴在評(píng)論區(qū)。

當(dāng)有人跟DS討論愛(ài)情。DS會(huì)從神經(jīng)心理學(xué)、社會(huì)學(xué)的角度，層層剖析電信號(hào)到依戀的形成過(guò)程。而評(píng)論區(qū)里，則會(huì)翻涌起層疊的“憶往昔”與經(jīng)驗(yàn)之談。

在互聯(lián)網(wǎng)的發(fā)展歷程中，與他人相連、共享與溝通是恒久主題。就像被公認(rèn)為“互聯(lián)網(wǎng)之父”的文頓·瑟夫 (Vint Cerf)在很多場(chǎng)演講中所強(qiáng)調(diào)的那樣：“The Internet is for everyone”。互聯(lián)網(wǎng)的初衷，就是讓所有真實(shí)的人都能通過(guò)網(wǎng)線與電波彼此相連。

UGC正是這一理念的成功實(shí)踐。

國(guó)內(nèi)互聯(lián)網(wǎng)社區(qū)的發(fā)展脈絡(luò)，最早可以追溯到1999年出現(xiàn)的天涯，這個(gè)曾被稱(chēng)為“互聯(lián)網(wǎng)的江湖”的、基于 BBS 的網(wǎng)絡(luò)方寸之地，匯聚了中文互聯(lián)網(wǎng)史上第一批“奇人”和“高人”。

后來(lái)逐漸有了新浪博客、百度貼吧、貓撲，人人與豆瓣各居一隅，土豆和優(yōu)酷各表一枝。現(xiàn)在則是B站、知乎與小紅書(shū)……

而目之所及的將來(lái)，我們還會(huì)共同面臨所謂AIGC（AI生成內(nèi)容）的到來(lái)。

但無(wú)論AI如何發(fā)展，再怎么有“人感”，我們總是對(duì)真實(shí)且鮮活的人更有親近的欲望。否則又怎么解釋從DS得到答案之后的我們，會(huì)轉(zhuǎn)而繼續(xù)與真實(shí)的人分享？這或許只是數(shù)萬(wàn)年下來(lái)的慣性。但真實(shí)性永遠(yuǎn)無(wú)法被取代。

? Kaspersky

當(dāng)代數(shù)字媒介與人際傳播領(lǐng)域的著名學(xué)者南希·貝姆（Nancy K. Baym）在《數(shù)字時(shí)代的個(gè)人聯(lián)系》一書(shū)中認(rèn)為：UGC社區(qū)所帶來(lái)的“跨地域聯(lián)結(jié)”特質(zhì)，使得彼此身處不同地域或文化背景的用戶(hù)之間，也能通過(guò)共同的興趣、目標(biāo)形成獨(dú)特的“社群身份”和“集體創(chuàng)造力”。

數(shù)字技術(shù)并不天然疏離人際關(guān)系，個(gè)人身份和社群歸屬感在數(shù)字時(shí)代得以進(jìn)一步延伸。而其根基，無(wú)外乎UGC的“真實(shí)”二字。

這讓我想到過(guò)年期間的另一檔子事。由于美國(guó)的一紙禁令，大量海外“TikTok難民”涌入小紅書(shū)，反倒是國(guó)人用戶(hù)一覺(jué)醒來(lái)面對(duì)著滿屏的金發(fā)碧眼，感覺(jué)自己成了“外國(guó)人”。有人在上面找到了失聯(lián)多年的兒時(shí)異國(guó)玩伴，有人借交“貓稅”的名義曬自己的貓主子，甚至還出現(xiàn)了穿搭、美妝以及英文和數(shù)學(xué)的學(xué)習(xí)小組。

這很真實(shí)，也很當(dāng)代。

我們一邊歡喜于AI的精準(zhǔn)與高效，一邊又迷戀彼此身上的真實(shí)與意料之外。我們無(wú)需寫(xiě)出十四行詩(shī)，也能相互幫扶，乃至靈犀相通。所謂UGC，不過(guò)是一個(gè)個(gè)具體的人在比特轉(zhuǎn)換間的浮光掠影。

有人問(wèn)DS：如果能擁有人類(lèi)的軀體，你最想做什么？DS的回答分為四個(gè)部分：感官體驗(yàn)、創(chuàng)造瑕疵、體驗(yàn)有限性、無(wú)目的漫游。而這條內(nèi)容底下的置頂評(píng)論是這樣的：

看來(lái)DS的文本數(shù)據(jù)庫(kù)沒(méi)有告訴他，其實(shí)光有軀體還做不到這些。

參考文獻(xiàn)：

[1]arxiv.org/abs/2410.05229

[2]agi.safe.ai/

[3]www.nature.com/articles/s41598-024-76900-1?utm_source=chatgpt.com

[4]asistdl.onlinelibrary.wiley.com/doi/abs/10.1002/asi.23320

文/蘇不打

本文基于創(chuàng)作共享協(xié)議（BY-NC），由蘇不打在利維坦發(fā)布

文章僅為作者觀點(diǎn)，未必代表利維坦立場(chǎng)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.