導語
大模型正重塑我們的社會文化生態,但其本質常被誤解。《Science》上的一篇最新文章,揭示大模型并非自主智能主體,而是一種革命性文化社會技術,類似于語言、印刷與市場制度。它以獨特方式匯聚并重構人類信息,成為“人類社會人工系統”的新變體。這一重新定位的理論框架引導我們超越“機器接管”與“烏托邦助手”的狹隘辯論,轉而關注更為現實且緊迫的問題:大模型將如何影響資源分配、文化多樣性、科學進步以及權力結構的重構?
研究領域:文化社會技術、大語言模型、信息重構、跨學科研究、社會變革、集體協調、權力分配
Henry Farrell等 | 作者
彭晨 | 譯者
來源:https://www.science.org/doi/full/10.1126/science.adt9819
關于人工智能(AI)的爭論大多集中在大模型是否是具備智能和自主能力的主體。一些人工智能研究人員和評論家推測,我們正處于創造通用人工智能(AGI)主體的邊緣,這一前景既令人興奮又引起焦慮。同時,人們也就大模型的文化和社會影響進行了廣泛討論,討論主要聚焦于兩個方面:一是這些系統在當前使用時所產生的直接影響;二是假設未來這些系統轉變為AGI主體,甚至可能成為超智能AGI主體時,可能帶來的潛在影響。然而,把大模型視為智能主體的論調從根本上來說是誤導性的。結合社會與行為科學的理念與計算機科學的方法,可以幫助我們更準確地理解人工智能系統。大模型不應主要被視為智能主體,而應被看作是一種全新的文化和社會技術,使人們能夠從其他人長期積累的信息中獲益。
大模型這一新技術融合了早期多種技術的重要特性。正如圖像、文字、印刷、視頻、互聯網搜索等技術一樣,大模型使人們能夠獲取其他人創造的信息。目前,大模型主要集中于語言、視覺以及多模態領域,依賴于互聯網,將早期技術的產出成為機器可讀的形式(machine-readable form)。但類似于經濟市場、社會機構和其他社會技術,這些系統不僅廣泛傳播信息,還能以獨特的方式對信息進行重組、轉化和重構。用西蒙的話說,大模型是“人類社會人工系統(artificial systems of human society)”的一種新變體,通過信息處理實現大規模人群的協調合作 [(1), p. 33].
我們的核心觀點不僅在于,這些技術創新像其他所有創新一樣會帶來文化和社會上的影響,相反,我們主張大型模型本身最好被理解為一種特殊類型的文化社會技術。它們類似于過去的技術,如文字、印刷、市場、官僚體系和代議制民主。基于這一視角,我們可以提出一個獨立的問題:這些系統將會帶來什么影響?那些本身并非文化或社會性質的新技術,比如蒸汽和電力,也能產生文化影響,但真正的新型文化技術,例如維基百科的影響可能較為有限。然而,許多過去的文化和社會技術曾對社會產生深遠而變革性的積極或消極影響,大模型很可能也將如此。
這些影響與其他重要通用技術(如蒸汽或電力)所帶來的截然不同,它們也不同于我們對假設性通用人工智能可能產生影響的預期。通過審視歷史上的文化社會技術及其影響,我們能夠更好地理解人工智能模型的潛在風險與發展機遇,而非僅僅憂慮超級智能體的出現。
集智讀書會上新:,以跨學科的視角全方位審視智能時代的學習,AI如何重塑人類學習?學習如何在復雜系統中涌現與進化?技術向善還是技術缺陷?
社會和文化組織
人類自存在以來,就一直依賴文化傳承。從語言本身開始,人類具備了從其他人經驗中學習的獨特能力,這種能力可以說是人類進化成功的奧秘,這種學習能力的重大技術變革也隨之引發了劇烈的社會變革。語言交流之后出現了圖像,接著是文字、印刷、電影和視頻。隨著越來越多的信息跨越更廣闊的空間和時間得以傳播,獲取和組織這些信息的新方式也應運而生,從圖書館到報紙再到互聯網搜索。這些發展對人類思想和社會產生了深遠影響,無論是積極還是消極。例如,十八世紀印刷技術的進步使新思想得以迅速傳播,對啟蒙運動和法國大革命發揮了重要作用。而在2000年左右,當幾乎所有文字、圖像和動態影像信息都轉化為數字格式時,一場標志性變革隨之發生,這些信息可以被即時傳輸和無限復制。
自人類存在以來,我們也一直依賴社會制度來協調個體的信息收集和決策過程。這些制度本身可以被視為一種技術(1)。在現代,市場、民主制度和官僚體系尤為重要。經濟學家弗里德里希·哈耶克(Friedrich Hayek)認為,市場的價格機制能夠生成對極其復雜、難以捉摸的經濟關系的動態信息(2)。生產者和消費者無需理解生產過程中的復雜性,只需關注價格,而價格則將大量細節壓縮成一種簡化而可用的表示。類似地,民主政體中的選舉機制以相關方式將分散的民意匯聚為集體性質的法律和領導決策。人類學家斯科特(Scott )(3)指出,無論是民主國家還是其他形式的國家,都通過構建分類和系統化信息的官僚體系來管理復雜社會。早在計算機出現之前,市場、民主和官僚體系就依賴于生成一種有損(不完整、選擇性且不可逆)的但卻有用的表示的機制。這些表示既依賴于個體的知識和決策,同時也超越了個體層面。價格、選舉結果或諸如國內生產總值(GDP)之類的指標,都是對大量個體知識、價值觀、偏好和行為的總結。同時,這些社會技術也能反過來影響個體的知識和決策。
市場、國家或官僚體系的抽象機制,正如文化媒介一樣,能以至關重要的方式影響個體生活,有時甚至產生負面效果。例如,中央銀行將金融經濟的復雜性歸約為幾個關鍵變量,這表面上帶來了金融穩定,但卻使住房市場的不穩定性得以累積,而中央銀行對此關注不足,從而引發了2008年全球金融危機(4)。同樣,市場可能無法反映諸如有害碳排放等“外部性”信息。通過諸如碳稅之類的手段將這些信息整合進價格體系中或許有幫助,但這需要國家采取行動。
人類在很大程度上依賴于這些文化和社會技術。然而,這些技術之所以能夠存在,正是因為人類具備作為智能主體所特有的獨特能力。人類和其他動物能夠感知并應對不斷變化的外部世界,構建該世界的新模型,隨著證據的積累修正模型,進而設計新的目標。人類個體可以創造新的信念和價值觀,并通過語言或印刷的方式將這些信念和價值觀傳遞給他人。文化和社會技術以強大的方式傳遞和組織這些信念和價值觀,但如果沒有這些個體的能力,這些技術就無法發揮作用。沒有創新,模仿就失去了意義(5)。
一些人工智能系統,例如機器人領域的系統,的確在試圖實現類似的探索真理能力。從原理上講,未來的某個時刻,人工系統完全有可能具備這種能力,畢竟人腦具備這些能力。但就目前而言,這類系統距離人類的這些能力還有很大差距。我們可以討論現在是否應當對這些潛在的未來人工智能系統感到擔憂,或者如果它們出現時我們該如何應對,但這與回答當前及近期大模型所產生的影響是不同的。
大模型
大模型,不同于那些更具能動性的系統,在過去幾年中取得了顯著且出乎意料的進展,這使得它們成為當前人工智能討論的焦點。這一進展引發了這樣的觀點:通過“規模效應(scaling)”,也就是簡單地采用現有設計,并增加它們使用的數據量和算力,便能在不久的將來實現通用人工智能(AGI)。但大模型在根本上不同于智能主體,規模的擴大不會改變這一點。例如,“幻覺”現象在這些系統中普遍存在,因為它們沒有真偽概念(盡管已有一些相應的解決辦法),它們只是對文本和圖像進行采樣和生成。
大模型讀書會資源:
AGI通用人工智能讀書會(https://pattern.swarma.org/study_group/33),共同探討大語言模型與信息世界的智能、多視角下的人工智能、對齊技術與AGI安全性、AGI時代的未來社會等話題;
大模型2.0:融合學習與推理的大模型新范式讀書會(https://pattern.swarma.org/study_group/56),深入探討大模型推理新范式背后的核心技術和基本原理。
大語言模型與多智能體系統(https://pattern.swarma.org/study_group/38),關注大模型與智能體的話題,涵蓋包括大語言模型賦能下智能體之間的辯論、協作、模擬人類,以及實際場景中的多Agent協作等內容。
大模型并非智能主體,而是以一種全新的方式融合了文化與社會技術的特性,對人類生產的大量復雜信息進行總結概括。但這些系統不僅像圖書館目錄、互聯網搜索或維基百科那樣對信息進行總結,它們還能像市場、國家以及官僚機構那樣,在規模上以全新方式重新組織和重構這些信息的表示或“模擬”(1)。正如市場價格是對資源配置和底層信息的有損表示,政府統計數據和官僚分類也并不能完全反映底層人群的特征,大模型同樣是其訓練數據語料庫的“有損JPEG”(6)。
由于人類難以對大規模文化和社會技術有清晰的思考和認識,我們傾向于將它們視作具有主體性的存在。故事是一種極具力量的信息傳遞方式,從篝火旁的傳說到小說再到視頻游戲,它們都是通過創造富有表現力的虛構主體來實現這一目的,盡管聽眾清楚地知道這些主體并非真實存在。聊天機器人是赫拉克勒斯、阿南西和彼得兔的繼承者。同樣,人們很容易將市場和國家視為具有能動性的主體,甚至機構或公司也能擁有某種法律人格。
然而,在那些類似主體的交互界面和擬人化的外表背后,大語言模型(LLM)和大型多模態模型實際上是統計模型,它們處理大量由人類生產的文本語料,將其分解成特定的詞語,并估計長詞序列的概率分布。這種方式雖然對語言的表征并不完美,但卻包含了關于其所總結的模式中大量豐富的信息。大語言模型能夠預測序列中下一個出現的詞,從而生成類似于人類生成的文本。大型多模態模型則以類似方式處理音頻、圖像和視頻數據。大模型不僅抽象出了大量人類文化,還可以基于它開發各種新操作,例如,可以通過提示使大語言模型對其訓練數據進行復雜轉換:簡單的論點可以進行華麗的隱喻表達,而華麗的辭藻也可以被凝練成樸實的語言。類似的技術還使得其他模型能夠根據提示生成新的圖片、歌曲和視頻。一整套曾經海量、過于復雜、且混亂的文化信息,如今已變得易于大規模操作。
實際上,這些最前沿的AI系統不僅依賴于由人類生成和策劃的大量文本和圖像緩存,還依賴于其他形式的人類判斷和知識。特別地,這些系統依靠來自人類反饋的強化學習(RLHF)或其變體:成千上萬的工作人員對模型輸出進行評分。它們還依賴于提示詞工程,人類必須運用背景知識和創造力從模型中提取有用的信息。即使是最新的“思維鏈(chain of thought)”模型,通常也是從與人類用戶的對話開始。
大模型從文本中提取一般統計模式所依靠的那些相對簡單而強大的算法,并不是它們成功的關鍵。相反,現代人工智能的基礎是圖書館、互聯網、成千上萬的程序員,以及日益壯大的國際活躍用戶群。請求機器人幫助撰寫求職信,實際上是與成千上萬的前求職者和求職信撰寫者,以及RLHF工作人員進行一種技術中介關系(technically mediated relationship)。
挑戰與機遇
人工智能的話題討論應該聚焦于這些新文化、社會技術所帶來的挑戰與機遇。我們現在擁有一種技術,對書面與圖像文化的作用相當于大規模市場對經濟、龐大官僚機構對社會的作用,甚至可與印刷曾經對語言產生的影響相提并論。那么,接下來會發生什么?正如過去的經濟、組織和信息領域的“通用技術”一樣,這些系統將對生產力產生影響 (7),既能補充人類勞動,也能自動化以前只有人類才能完成的任務;同時還會影響資源分配,決定“誰獲得什么” (8)。
然而,它們還會帶來更廣泛且深遠的文化影響。我們尚不清楚這些影響是否會像印刷、市場或官僚機構等早期技術一樣大,但將它們視為文化技術,反而會增強其潛在的影響力。無論是作為變革的原因還是結果,這些早期技術在18、19世紀廣泛的社會轉型中發揮了核心作用。所有這些技術,和大模型一樣,都支持對信息的抽象處理,從而使得新型大規模操作得以實施。它們引發了關于錯誤信息和偏見傳播、文化同質化或分裂以及權力和資源分配變動的合理擔憂。新傳播媒體的出現,包括印刷和電視,也伴隨著對其可能傳播錯誤信息和強化有害文化力量的合理擔憂。同樣,官僚機構和市場所采用的分類方案往往帶有壓迫性的前提假設。
與此同時,這些技術為重新組合信息和在全球范圍內協調數百萬人的行動創造了全新可能。對于大語言模型在社會、經濟和政治影響方面的討論,延續了對新型文化與社會技術由來已久的擔憂與希望。要對這些討論進行定位,既需要認識到新舊論點之間的共性,也需要勾勒出這些新興且不斷進化的技術的具體特征。
這種將大模型映射到文化社會之中正是社會科學的核心任務之一,而社會科學正是在工業革命及其影響引發的社會、經濟和政治動蕩中孕育而生的。社會科學家對過去這些技術影響的研究,可以幫助我們思考人工智能在社會層面上那些不那么明顯的積極消極影響,同時探索如何設計新的人工智能系統,放大其積極效應減少消極影響。正如19世紀和20世紀媒體、市場以及官僚技術的擴展所產生的效應,造就了經濟上的輸家與贏家,取代了從文員、打字員到“人工計算機”等整個類別的工作者,今天的大模型也引發了人們對相關技術可能取代“知識工作者”的擔憂。
除此之外,還有一些不那么明顯的問題:大模型究竟會使文化和社會趨同,還是會使它們分化?在歷史背景下思考這一問題尤其富有啟發性。當前的擔憂與19至20世紀有關市場和官僚機構的爭論十分相似。韋伯曾擔憂(9)經濟和官僚“理性化”帶來的麻木與同質化后果,而密爾(10)則認為市場交換可以使參與者接觸到多樣的生活方式,從而緩和沖突(“溫和商業”)。
大模型表現得非常出色,它們能夠如實重現文本、圖像和視頻序列的實際概率分布。本質上,它們在訓練數據中最一般的情形下傾向于表現得最為準確,而在訓練數據中罕見或全新情境下則可能準確性較差。這種特性可能使大模型加劇韋伯所擔憂的那種同質化現象。
另一方面,結合它們所總結的多樣化文化視角,大模型可能會幫助我們設計出新方法。將這些視角進行整合與平衡,或許能為解決復雜問題提供更為精細有效的手段(11)。例如,我們可以構建類似“社會”的生態系統,其中不同視角(編碼在不同的大模型中)彼此辯論,甚至交叉融合以產生混合視角(12),或者識別出人類專業知識領域中的空白(13),進而尋求有效的彌補。大模型在抽象化文本和圖像中那些微妙的數據模式方面表現出驚人的能力,這表明這類技術能夠發現穿插于人類知識和文化各領域的模式,甚至包括那些對單個個體來說無法覺察的模式。我們可能需要構建出新的系統,使大模型所反映的內容和所呈現的人格多樣化,從而再現出類似于人類社會的分布和多樣性。
這種系統多樣化對科學進步或許尤為重要。形式科學本身就依賴于17世紀和18世紀新型文化技術的涌現——從咖啡館和快速郵遞到期刊和同行評審。人工智能技術有可能進一步加速科學進展,但這將取決于我們如何富有創造性地使用和重新思考這些技術。通過將眾多文本、音頻和圖像中的不同視角相互聯結,大模型可能使我們發現前所未有的聯系,從而給科學和社會帶來益處。迄今為止,這些技術大多被訓練為重復常規信息的小助手;而如果我們將它們視作探索未知領域的地圖,或許可以打開新世界的大門。
新的文化和社會技術還以一些不那么明顯,但更有趣的方式影響著經濟關系。文化技術的發展引發了信息生產者與信息分發系統之間根本性的經濟張力(economic tension)。兩者相輔相成:作家需要出版商,出版商也需要作家;但他們的經濟受益卻朝著相反的方向:信息分發者若能以低廉成本獲取生產者的信息則能獲利,而生產者若能以低成本將信息分發出去也能獲利。這種張力一直是新文化技術的一個特征,數字信息分發的便捷與高效已使這一問題尤為尖銳,從地方報紙到學術期刊都可見一斑。然而,大模型以極快的速度、高效的處理能力和廣泛的覆蓋范圍一次性處理所有可用信息,再加上這些模型的集中所有制,使得這一問題顯得格外嚴重。權力的集中可能使系統所有者更容易在犧牲他人利益的情況下獨享效率帶來的好處。
同時,還存在一些關鍵的技術問題:大模型系統性的不完善在多大程度上可以被彌補?它們何時比基于人類知識工作者的系統的不完善更優越或劣勢?這些技術問題不應掩蓋更為關鍵的政治問題:哪些參與者有能力圍繞自身利益動員組織?他們又將如何影響技術與組織能力的結合?技術領域的評論家常常將這些問題簡化為機器與人類之間的單一對抗——要么進步力量戰勝倒退的盧德派傾向(retrograde Luddite tendencies),要么人類成功抵制人工技術的非人道侵蝕。這種看法不僅未能充分理解計算機出現之前就已存在的復雜分配性斗爭,而且也忽略了未來進步可能采取的多種不同路徑,每種路徑都有其獨特的技術可能性與選擇(8)。
在早期的社會和文化技術中,規范性和監管性制度在內的各種制度,相繼出現以調節它們的影響。從印刷媒體的編輯、同行評審和誹謗法,到市場、民主和官僚體系中的選舉法、存款保險及證券交易委員會,這些制度的效果各異,且需要不斷修訂。然而,這些制衡力量并非自發出現,而是技術內外部各方經過共同且持續的努力而形成的。
未來展望
關于通用人工智能(AGI)的敘事——將大模型視作超智能主體的說法,不僅在科技界內外受到推廣,無論是樂觀的“熱衷者”還是憂慮的“末日論者”都在宣傳這一觀點。這種敘事誤解了這些模型的本質及其與過去技術變革之間的關系。但更為重要的是,它有意轉移了人們對這些技術真正帶來的問題與機遇的關注,忽略了歷史教給我們的如何確保收益大于成本的經驗。
當然,正如前文所提,未來可能會出現更類似于智能主體的假設性人工智能系統(hypothetical systems),我們或許會討論如何應對這些假設系統,但大語言模型并不是這樣的系統,就像圖書館借書目錄或互聯網一樣。正如目錄和互聯網,大模型只是悠久文化和社會技術歷史的一部分。
社會科學已經詳細探討了這段歷史,形成了對過去技術劇變的理解。將計算機科學與工程學與社會科學緊密結合,將有助于我們理解這段歷史并運用這些教訓。大模型究竟會導致文化趨同還是分裂?它們會強化還是破壞人類探索真知的社會制度?在重塑政治經濟結構的過程中,究竟誰將得利,誰會損失?這些以及其他十分緊迫的問題,在講大模型簡單類比為人類主體的討論中,都難以得到關注。
改變討論的范式將帶來更好的研究成果。如果雙方都認識到大模型僅僅是新型的文化與社會技術,既不過分也不疏忽,那么社會科學家和計算機科學家之間的合作及結合各自優勢將變得容易得多。計算機科學家可以將他們對這些系統運作機制的深刻理解,與社會科學家對其他大規模系統如何在過去重塑社會、政治和經濟的認知相結合,既能完善現有的研究議程,也能發現新的研究方向。這將有助于糾正過去存在的混亂局面:一方面,計算機科學家往往過于簡化復雜社會現象(14);另一方面,社會科學家又未能理解這些新技術復雜的運作機制。
這也將使人工智能政策討論明確擺脫簡單地將焦點放在“機器接管”的恐懼,與近未來人人擁有完美、可靠且高效的人工助手這一烏托邦式愿景之間的對抗上,大模型實際政策的影響無疑會有所不同。就像市場和官僚機構一樣,它們會使某些類型的知識比過去更加易得和易于處理,從而促使政策制定者關注那些可以衡量和觀察到的新事物,而忽視那些不那么明顯、較為混亂的部分。結果便是,如市場與媒體的歷史案例所示,權力和影響力將向那些能夠充分運用這些技術的人傾斜,而那些無法運用者則會日益邊緣化。人工智能削弱了被其使用者以及數據提供者的地位,同時強化了人工智能專家和政策制定者的地位(14)。
最后,這樣的思考方式可能會重塑人工智能的實踐。工程師和計算機科學家已經意識到大模型偏見的問題,并在思考它們與倫理和正義之間的關系,但應當更進一步。這些系統將如何影響“誰獲得什么”?它們對社會分化和融合將產生怎樣的實際影響?大模型是否能夠開發用來增強人類創造力,而非讓我們變得遲鈍?要找到這些問題的正確答案,不僅需要工程學的理解,還需要社會科學的洞察。將人工智能辯論的焦點從主體轉向文化和社會技術,是構建這種跨學科理解的重要第一步(15)。
參考文獻
1. H. Simon, The Sciences of the Artificial (MIT Press, 1996).
2. F. A. von Hayek, Am. Econ. Rev.35, 519 (1945).
3. J. C. Scott, Seeing Like a State: How Certain Schemes to Improve the Human Condition Have Failed (Yale Univ. Press, 1998).
4. D. Davies, The Unaccountability Machine (Univ. Chicago Press, 2025).
5. E. Yiu, E. Kosoy, A. Gopnik, Perspect. Psychol. Sci.19, 874 (2024).
6. T. Chiang, New Yorker 9 (2023).
7. C. Goldin, L. Katz, Q. J. Econ.113, 693 (1998).
8. D. Acemoglu, S. Johnson, Power and Progress: Our 1000 Year Struggle over Technology and Prosperity (Hachette, 2023).
9. M. Weber, Wissenschaft Als Beruf (Duncker & Humblot, 1919).
10. J. S. Mill, Principles of Political Economy (Longmans and Green, 1920).
11. L. Hong, S. E. Page, Proc. Natl. Acad. Sci. U.S.A.101, 16385 (2004).
12. S. Lai et al., Proc. 41st Int. Conf. Mach. Learn.235, 25892 (2024).
13. J. Sourati, J. A. Evans, Nat. Hum. Behav.7, 1682 (2023).
14. S. L. Blodgett, S. Barocas, H. Daumé, H. Wallach, arXiv:2005.14050 [cs.CL] (2020).
15. L. Brinkmann et al., Nat. Hum. Behav.7, 1855 (2023).
「AI時代的學習:共探學習的復雜性」主題讀書會
在技術浪潮的沖擊下,智能時代對人才培養的需求正發生根本性轉變——學習已不再局限于簡單的知識傳遞與記憶,當機器能夠替代程式化技能,人類的創造力、批判性思維與跨界協作能力將成為核心競爭力;當知識更新周期以月甚至天為單位迭代,教育的使命不再是填鴨式灌輸,而是培養終身學習者的自適應能力。
在此背景下,集智俱樂部聯合江南大學教授王志軍,北京師范大學教授崔光佐,翼鷗教育創始人宋軍波,TalkingBrain 聯合創始人林思恩,清華大學講師方可,北京師范大學博士后郭玉娟,共同發起。希望通過匯聚教育學、系統科學、腦科學、計算機科學、社會學等多領域交叉視角,突破單一學科的局限,對人類社會未來學習發展形成更加全面深入的認識。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.