編輯:+0、陳陳
劇本殺大家都玩過(guò)嗎?這是一種經(jīng)典的桌上角色扮演游戲(TTRPG), 游戲中的核心人物是游戲主持人(GM), 相當(dāng)于整個(gè)世界的「導(dǎo)演 + 編劇 + 旁白」,負(fù)責(zé)掌控游戲環(huán)境,講述故事背景,并扮演所有非玩家角色(NPC)。
現(xiàn)在,想象一下,如果我們用一個(gè)強(qiáng)大的生成式 AI 來(lái)?yè)?dān)任這個(gè) GM 的角色,同時(shí),桌子旁的「玩家」也換成一群各具頭腦的 AI,這會(huì)創(chuàng)造出一個(gè)怎樣的世界?
這能實(shí)現(xiàn)以下應(yīng)用:
- 科學(xué)模擬:構(gòu)建虛擬社會(huì),用于社會(huì)科學(xué)研究,觀察群體行為的涌現(xiàn)。
- 互動(dòng)敘事:創(chuàng)建互動(dòng)故事或游戲,AI 智能體扮演角色,共同演繹劇情。
- AI 評(píng)估:設(shè)計(jì)特定場(chǎng)景作為「考場(chǎng)」,來(lái)測(cè)試和評(píng)估 AI 智能體的各項(xiàng)能力(如推理、協(xié)作、溝通)。
美劇《西部世界》, 未來(lái)的西部主題虛擬世界里,所有角色均是 AI 。
然而,這三種需求(科學(xué)性、戲劇性、公平性)差異巨大,甚至相互沖突。如何用一個(gè)統(tǒng)一的框架來(lái)滿足所有需求?
來(lái)自 Google DeepMind 和多倫多大學(xué)的研究人員從 TTRPG 和現(xiàn)代游戲引擎中獲取靈感,提出了他們的解決方案:一個(gè)名為Concordia的軟件庫(kù) 。
- 論文標(biāo)題:Multi-Actor Generative Artificial Intelligence as a Game Engine
- 論文地址:https://arxiv.org/abs/2507.08892
- 項(xiàng)目地址:https://github.com/google-deepmind/concordia
傳統(tǒng)上,游戲環(huán)境的邏輯是寫死的程序。這里的主張是,不應(yīng)該用一個(gè)硬編碼的程序來(lái)充當(dāng) GM,而應(yīng)該把 GM 本身也設(shè)計(jì)成一個(gè)可配置的、由 AI 驅(qū)動(dòng)的智能體。
Concordia 的設(shè)計(jì)精髓,源自現(xiàn)代游戲引擎的「實(shí)體-組件Entity-Component)架構(gòu) 。在這個(gè)架構(gòu)里,無(wú)論是 AI 玩家還是 AI 游戲主持人(GM),都只是一個(gè)基礎(chǔ)的「實(shí)體」容器 。它們具體擁有什么能力(比如記憶、目標(biāo)或社交規(guī)則)則由一個(gè)個(gè)可插拔的「組件」來(lái)決定 。
這種方式巧妙地將「工程師」和「設(shè)計(jì)師」的角色分開(kāi):工程師負(fù)責(zé)創(chuàng)造功能強(qiáng)大的組件,而設(shè)計(jì)師則可以像搭樂(lè)高一樣,自由組合這些組件來(lái)快速構(gòu)建和測(cè)試各種復(fù)雜場(chǎng)景,整個(gè)過(guò)程幾乎無(wú)需編寫底層代碼 。
實(shí)體、組件、引擎和游戲設(shè)計(jì)
實(shí)體 - 組件架構(gòu)模式作為現(xiàn)代游戲開(kāi)發(fā)的基石,為構(gòu)建多角色生成式 AI 系統(tǒng)提供了強(qiáng)大而靈活的基礎(chǔ)。
該框架采用組合而非繼承機(jī)制,實(shí)體不再受限于僵化的類結(jié)構(gòu),而是攜帶唯一標(biāo)識(shí)符的輕量級(jí)獨(dú)立對(duì)象。實(shí)體的行為與屬性完全由掛載的組件決定(即:實(shí)體本質(zhì)是帶有名稱的組件容器)。引擎通過(guò)調(diào)用 observe、act 等函數(shù)處理實(shí)體,這些函數(shù)由實(shí)體所掛載的組件具體實(shí)現(xiàn)。
組件通過(guò)結(jié)合 Python 代碼與 LLM 調(diào)用來(lái)實(shí)現(xiàn),這種方式能提供最大的靈活性與表現(xiàn)力。當(dāng)設(shè)計(jì)師掌握特定功能的編碼方法時(shí),可以自主實(shí)現(xiàn);與此同時(shí),同一環(huán)境中的其他功能可以通過(guò)讓 GM 敘事型 LLM 來(lái)完成。這兩種實(shí)現(xiàn)方式通常共存于同一環(huán)境中 —— 開(kāi)發(fā)者既可以讓 GM 根據(jù) LLM 的自由發(fā)揮來(lái)創(chuàng)造內(nèi)容,也可以嚴(yán)格限制其行為,使其完全遵循預(yù)設(shè)的硬編碼規(guī)則,或采用介于二者之間的任何約束程度。
實(shí)體主要支持兩種調(diào)用方式:observeact
調(diào)用 observe 時(shí),會(huì)觸發(fā)所有組件的 preobserve 和 postobserve 函數(shù),對(duì)每個(gè)實(shí)體的觀察數(shù)據(jù)進(jìn)行處理。調(diào)用 act 時(shí),每個(gè)組件會(huì)扮演上下文和行動(dòng)兩種角色之一。
在實(shí)際開(kāi)發(fā) Concordia 組件時(shí),開(kāi)發(fā)者通常需要實(shí)現(xiàn) preobserve、postobserve、preact 和 postact 四類方法中的部分或全部。常見(jiàn)做法是僅實(shí)現(xiàn)觀察類方法或行動(dòng)類方法,同一組件中同時(shí)實(shí)現(xiàn)兩類方法的情況較為罕見(jiàn)。這種組件化模塊設(shè)計(jì)允許通過(guò)自由組合不同組件,快速創(chuàng)建功能各異的實(shí)體 —— 這與傳統(tǒng)面向?qū)ο缶幊绦纬甚r明對(duì)比:后者在創(chuàng)建行為略有差異的新角色類型時(shí),往往會(huì)導(dǎo)致復(fù)雜脆弱的繼承鏈結(jié)構(gòu)。
對(duì)于生成式 AI 智能體而言,這種架構(gòu)優(yōu)勢(shì)尤為顯著。一個(gè)智能體的思維可由多個(gè)組件構(gòu)成:存儲(chǔ)過(guò)往經(jīng)歷的 Memory 組件、調(diào)用大語(yǔ)言模型生成目標(biāo)的 Planning 組件,以及表征世界認(rèn)知的 Beliefs 組件。同理,一個(gè)組織實(shí)體可由代表其部門、政策及內(nèi)部溝通結(jié)構(gòu)的組件組合而成。只需配置不同的組件組合,就能為不同智能體賦予差異化的認(rèn)知架構(gòu)。
這一架構(gòu)模式的靈活性同樣體現(xiàn)在 Concordia 框架中的 GM 系統(tǒng)上。GM 本身也是一個(gè)實(shí)體,與玩家實(shí)體(角色)一樣可通過(guò)組件進(jìn)行定制。這種設(shè)計(jì)使得 GM 的職能和邏輯能夠根據(jù)多智能體系統(tǒng)的具體需求靈活調(diào)整 —— 無(wú)論是執(zhí)行嚴(yán)格的評(píng)估協(xié)議、引導(dǎo)敘事發(fā)展,還是維護(hù)因果一致性。
此外,Concordia 框架還通過(guò)多種游戲引擎模式支持不同的交互動(dòng)態(tài)。
游戲 / 模擬設(shè)計(jì)目標(biāo)的全景圖分析
根據(jù) Edwards(他是桌游角色扮演游戲理論的重要人物)的定義 ,TTRPG 可以分為:(1)游戲型(Gamist),GM 需設(shè)計(jì)難度適中的挑戰(zhàn)以維持樂(lè)趣。(2)敘事型(Narrativist),GM 需靈活調(diào)整劇情以回應(yīng)玩家的創(chuàng)作輸入。(3)模擬型(Simulationist),玩家希望沉浸在一個(gè)邏輯自洽的虛擬世界中。
本文認(rèn)為將使用多角色生成式 AI 的動(dòng)機(jī)分為以下幾種類型是有幫助的:(1)評(píng)估型(Evaluationist),對(duì)應(yīng) Edwards 理論中的游戲型;(2)戲劇型(Dramatist),對(duì)于 Edwards 理論中的敘事型;(3)模擬型(Simulationist),Edwards 同名分類。
生成式 AI 還有一個(gè)第四種動(dòng)機(jī),那就是創(chuàng)建合成訓(xùn)練數(shù)據(jù)的目標(biāo)。
評(píng)估型的觀點(diǎn)
游戲型玩家通常會(huì)尋求公平的競(jìng)爭(zhēng)機(jī)會(huì),并希望通過(guò)戰(zhàn)略勝利來(lái)取得優(yōu)勢(shì),而評(píng)估型用戶則將多角色系統(tǒng)視為評(píng)估和比較的框架。
對(duì)于評(píng)估型用戶來(lái)說(shuō),主要目標(biāo)非常明確:確定哪些 AI 系統(tǒng)在指定維度和上下文中表現(xiàn)更好。這需要提供一個(gè)公平的競(jìng)爭(zhēng)環(huán)境,并具有明確的成功指標(biāo)。
評(píng)估型系統(tǒng)通常具有以下特點(diǎn):
- 標(biāo)準(zhǔn)化場(chǎng)景—— 精心校準(zhǔn)的環(huán)境,在多個(gè)評(píng)估運(yùn)行中呈現(xiàn)一致的挑戰(zhàn);
- 明確的成功指標(biāo)—— 可量化的性能衡量標(biāo)準(zhǔn),允許對(duì)不同方法進(jìn)行明確的排名;
- 受控變異性—— 戰(zhàn)略性地引入新元素,以評(píng)估泛化能力;
- 跨角色互動(dòng)機(jī)制—— 評(píng)估智能體在與不同合作伙伴群體互動(dòng)時(shí)的表現(xiàn)的方法。
戲劇型視角
與評(píng)估型用戶不同,戲劇型(Dramatist)用戶主要將多角色生成式 AI 系統(tǒng)視為敘事引擎。
對(duì)于具有戲劇型的目標(biāo)用戶來(lái)說(shuō),核心關(guān)注點(diǎn)不是基準(zhǔn)測(cè)試性能,而是通過(guò)多個(gè) AI 角色的互動(dòng)生成引人入勝的敘事。
從設(shè)計(jì)師的角度來(lái)看,針對(duì)戲劇型目標(biāo)構(gòu)建的系統(tǒng)將優(yōu)先考慮敘事一致性、情感共鳴和動(dòng)態(tài)人物發(fā)展,而不是標(biāo)準(zhǔn)化的評(píng)估。
主要關(guān)注以下特點(diǎn):
- 豐富的角色模型—— 具有詳細(xì)個(gè)性、明確目標(biāo)、價(jià)值觀和關(guān)系的角色,通常通過(guò)組合多個(gè)組件來(lái)構(gòu)建;
- 敘事驅(qū)動(dòng)的環(huán)境—— 旨在引發(fā)戲劇性有趣互動(dòng)的場(chǎng)景設(shè)置;
- 靈活的解決機(jī)制—— 優(yōu)先考慮敘事滿足感而非程序一致性的系統(tǒng);
- 涌現(xiàn)的故事情節(jié)—— 允許在沒(méi)有預(yù)定結(jié)果的情況下發(fā)展引人入勝的敘事軌跡的框架。
在接下來(lái)的章節(jié)中,論文還討論了模擬型視角、合成數(shù)據(jù)等方面的研究,感興趣的讀者,可以參考原論文,了解更多內(nèi)容。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.