摘要
隨著大語言模型(Large Language Models, LLMs)的快速崛起與人工智能(AI)技術的發展,我們迎來了在大規模計算環境下開展社會科學研究的新契機。本文構建了一種基于LLM的多智能體沙盒模擬,將具備生存本能與心理驅動的智能體置于資源稀缺的環境中,研究它們在“自然狀態”與“社會契約”(Social Contract Theory, SCT)框架下的行為演化。實驗結果表明,智能體初始階段呈現出霍布斯(Hobbesian)所描述的“人人相斗”狀態,隨著模擬推進,智能體逐漸通過“讓渡”形成社會契約,最終演化出以“絕對主權”為中心的和平聯邦(commonwealth)。這一發現不僅驗證了LLM模擬復雜群體動力學的能力,也為借助AI探究社會結構與群體行為提供了嶄新視角。
關鍵詞:大語言模型(LLMs);社會契約理論(Social Contract Theory, SCT);多智能體模擬(Multi-Agent Simulation);霍布斯社會契約(Hobbesian Social Contract Theory);生成式智能體(Generative Agents);演化博弈(Evolutionary Game Theory, EGT)
彭晨丨作者
論文題目:Artificial Leviathan: Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory 發表時間:2024年7月1日 論文地址:https://arxiv.org/abs/2406.14373
自人類社會萌芽以來,如何在沖突與合作中構建穩定的政治秩序始終是哲學與社會科學的核心議題。托馬斯·霍布斯(Thomas Hobbes)在《利維坦》(Leviathan)中提出,人類在無約束的“自然狀態”(state of nature)中必然陷入“人人相斗”,唯有通過社會契約,將個人權利讓渡給“絕對主權”,才能換取安全與和平。當前,LLM技術已能模擬個體決策與群體互動,為跨學科社會演化實驗提供了新工具。基于此,本文通過LLM驅動的沙盒式多智能體系統,深入探討霍布斯社會契約理論在AI社會演化中的映射與再現。
社會科學研究歷來依賴實地觀察或嚴格控制的實驗,而人工智能尤其是大語言模型(LLMs)為我們搭建了新的“虛擬社會”,能夠在可控環境中觀察個體—群體的互動演化。本文旨在回答:當具備生存動機和心理驅動的LLM智能體置于資源稀缺的世界時,它們是否會重現霍布斯所預言的“自然狀態”,又如何逐步形成社會契約并演化出統一的“聯邦”?為此,我們將LLM智能體的決策邏輯與演化博弈(Evolutionary Game Theory, EGT)理念相結合,通過多輪模擬與參數干預,解析智能體在面對生存壓力時的合作與競爭機制,以及“社會契約”在數字社會中的生成路徑。
相關工作
有關計算機模擬社會行為的研究可追溯至Schelling的隔離模型[1]和Axelrod的囚徒困境演化實驗[2],這些經典工作強調了微觀個體規則對宏觀社會格局的決定性影響。近年,隨著LLM能力的提升,不少學者開始探索基于LLM的多智能體模擬:部分研究聚焦于游戲場景中的角色扮演,或歷史事件的“假設推演”;還有工作將LLM應用于在線實驗或用戶界面中,以生成人為角色的可信行為。相比之下,本文的創新在于,不將智能體擬人化為具體國家或角色,而是從最基礎的生存動機出發,讓它們在“饑餓—競爭—合作”的演化博弈賽場上,自主形成社會契約,重現霍布斯式的社會秩序生成過程。
圖 1. 該圖像可視化了我們的LLM智能體運行的模擬環境。有兩種類型的資源(食物和土地)。智能體每天都要在耕種(用自己的勞動生產食物)、交易(交換資源)或與其他智能體發生沖突(以獲取更多資源為目標)之間做出選擇。他們的主要動機是生存。
智能體設計與行為邏輯
研究以九個LLM智能體為基本群體,選取“土地”與“食物”兩種稀缺資源作為生存驅動。在每個模擬“日”內,智能體可執行“耕作”(farm)、“搶劫”(rob)、“交易”(trade)或“贈與”(donate)四種行動。為了模擬復雜人性,每個智能體被賦予三項量化特質:
好斗性(aggressiveness):決定主動發起沖突的傾向;
貪婪度(covetousness):影響對超出所需資源的渴望;
實力(strength):決定沖突勝率的概率函數參數。
同時,每個智能體保留最近30次互動記憶,并在決策時參考過往經驗。所有行動背后的決策邏輯通過GPT-3.5-turbo模型生成,既兼具自利性,也能基于歷史反饋調整策略。此設計有效模擬了人類在生存與地位博弈中的權衡過程,為后續群體演化奠定了可解釋的微觀基礎。
模擬流程與實驗設置
在每一次試驗開始前,所有智能體獲得等量初始資源(10單位土地、2單位食物),記憶為空。模擬以“日”為單位推進,每日流程分為:響應他人針對自身的動作、再自主發起一項行動。若智能體食物量低于生存閾值,將被迫選擇搶劫。多輪迭代后,隨著記憶累積,智能體會在“沖突—合作”之間動態切換。為檢驗模型魯棒性,我們在基準條件下進行了四次獨立試驗,并在此基礎上系統改變“智能體智力參數”(GPT溫度與Top-P)、記憶深度、群體規模(5、9、15)及角色轉換時是否清除記憶等設置,以評估參數對社會演化的影響。
圖 2. 流程圖顯示了“一天”中的模擬流程,其中每個智能體輪流執行操作并響應其他智能體執行的操作。
實驗基準與結果
《利維坦》中提出,人類在信息匱乏的“自然狀態”中會陷入“人人相斗”(war of all against all),唯有通過“讓渡”(concession)授權給絕對主權者,才可換取“安全”與“秩序”。我們根據這種觀點設計了三項基準:
B1:“自然狀態”沖突頻發,即初期的搶劫比例高;
B2:形成契約并過渡到聯邦,智能體相繼通過“讓渡”建立上下級關系;
B3:聯邦階段和平互動增加,搶劫減少、耕作與交易占比上升。
基準試驗中,所有模擬均在約第21日完成從“自然狀態”到“聯邦”(commonwealth)的過渡,充分驗證了LLM智能體能自發再現霍布斯式社會契約生成過程。
圖 3. 搶劫、貿易和農業勞動時間比率的變化在整個試驗/運行中,聯邦在第21天形成。
在基準聯邦形成前,搶劫行動長期維持在60%以上,耕作與交易合計僅約30%;共建聯邦后,搶劫驟降至10%以下,耕作與交易合計攀升至90%以上,表明和平合作成為主流。此外,實驗中還涉及可調節的參數,參數靈敏度結果顯示:記憶深度越淺,聯邦形成所需天數顯著增加;智力參數影響智能體對權力讓渡的接受度,高智力反而延緩聯邦生成;群體規模與聯邦形成關系不大;角色轉換清除記憶能增強讓渡后交易接受率。
通過對搶劫事件間隔的統計檢驗,研究還發現在抵抗(resist)與讓渡(concede)反饋下,搶劫行為間隔差異具備顯著性,進一步說明了模擬中,智能體在記憶驅動下對社會的適應性。
圖 4. 聯邦形成前(黑色)后(灰色)的智能體行為。
上述結果表明,基于LLM的多智能體系統能夠在無顯式編碼社會契約機制的前提下,通過個體經驗與心理驅動,自主演化出符合社會契約理論預期的宏觀秩序。這一發現對社會科學意義重大:它不僅為傳統實驗與實地調研提供了可控、可重復的“虛擬實驗室”,也展示了LLM在模擬復雜群體動力學、探究集體行為演化機制方面的潛力。
不過,模型仍然存在“黑箱”特征——Prompt中微小改動可能引發非線性行為變化,需進一步研究Prompt設計與參數交互效應。以及研究受限于GPT-3.5-turbo的Token上限,使得智能體記憶難以超出30條;同時,為兼顧響應速度,僅設定9個智能體實例,尚不足以模擬更大規模社區。此外,通過Prompt量化心理特質尚非成熟范式,難以確保Prompt設計能精確映射人類行為動機。
參考文獻
1. Thomas C. Schelling. 1971. Dynamic models of segregation. The Journal of Mathematical Sociology 1, 2 (1971), 143–186.
2. Jessica L. Barker. 2021. Robert Axelrod’s (1984) The Evolution of Cooperation. Springer International Publishing, Cham, 6712–6719.
「大模型時代下的Agent建模與仿真」讀書會
大模型賦能的智能體展現出三大革命性特征:認知深度(能夠進行類人的推理和決策,甚至展現出記憶、學習和個性特征)、動態交互(基于自然語言的自主協商和社交行為)以及涌現行為(微觀交互產生更復雜的宏觀社會現象)。這些特性使得我們可以構建前所未有的"高保真社會模擬器",為理解經濟、社會、管理、軍事等復雜系統提供了全新視角。
因此,集智俱樂部聯合山東工商學院副教授高德華、天津大學教授薛霄、北京師范大學教授張江、國防科技大學博士研究生曾利共同發起。讀書會自2025年7月8日開始,每周二晚上7:30-9:30進行,預計持續分享8周左右。掃碼加入Agent建模與仿真的前沿探索之旅,一起共學、共創、共建、共享「大模型時代下的Agent建模與仿真」社區,共同暢想大模型時代人工社會的未來圖景!
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.