這些年來,AI打游戲的出色表現(xiàn)已經(jīng)讓人見怪不怪了。
2018年《星際爭(zhēng)霸》舉辦了AI挑戰(zhàn)賽,參賽隊(duì)伍八仙過海、各顯神通;2019年,《王者榮耀》的絕悟在世界冠軍杯表演賽中打贏了五個(gè)現(xiàn)役職業(yè)選手;2022年,《暗區(qū)突圍》推出了號(hào)稱全球首個(gè)能用語音指揮的AI 隊(duì)友F.A.C.U.L.,直接拉滿了競(jìng)技類游戲的最高配置。
不搶資源、配合指揮,而且會(huì)講冷笑話,簡(jiǎn)直情緒價(jià)值拉滿
不過,這些AI玩家都屬于“單游戲智能體”,專門針對(duì)單一游戲訓(xùn)練,且需要海量數(shù)據(jù)支持。
說人話就是,這些AI必須提前學(xué)習(xí)識(shí)別場(chǎng)景中的建筑、物體、裝飾、可交互物件,對(duì)局中的微操和戰(zhàn)術(shù)配合,也只能靠人工標(biāo)記和強(qiáng)化訓(xùn)練,投入游戲中使用還會(huì)耗費(fèi)大量算力。
即便是谷歌2022年推出的多游戲智能體Transformer,能玩41款雅達(dá)利游戲,但也依賴于大量預(yù)先學(xué)習(xí)的數(shù)據(jù)。
說白了,它們都必須模仿人類,需要靠“看攻略”來維持智商。
但最近,加州大學(xué)圣地亞哥分校的Hao AI實(shí)驗(yàn)室進(jìn)行了一項(xiàng)特別的AI推理能力測(cè)試,他們選取了四個(gè)不同的AI模型,在沒有任預(yù)先前訓(xùn)練的情況下,直接讓它們玩《逆轉(zhuǎn)裁判》——四位“參賽選手”分別是Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick以及OpenAI o1。
換句話說,整個(gè)過程需要AI自主理解游戲畫面、劇情與機(jī)制,并推動(dòng)游戲進(jìn)程——幾乎和第一次接觸這款游戲的新玩家沒什么區(qū)別。
而最終的結(jié)果也令人意外:Llama-4 Maverick在游戲一開始就早早出局,Gemini 2.5 Pro和Claude 3.7 Sonnet進(jìn)入了第二章《逆轉(zhuǎn)姐妹》,而OpenAI o1則是一口氣打到了第二集結(jié)尾,雖然沒有完全通關(guān),但表現(xiàn)令人稱道。
四個(gè)模型同臺(tái)競(jìng)技最終成績(jī)
為什么選擇《逆轉(zhuǎn)裁判》來考驗(yàn)AI?
根據(jù)Hao AI實(shí)驗(yàn)室的解釋,主要目的有三個(gè):一是為了考驗(yàn)AI的長(zhǎng)語境推理能力,《逆轉(zhuǎn)裁判》需要AI交叉引用先前的對(duì)話和證據(jù),發(fā)現(xiàn)其中的矛盾;二是考驗(yàn)視覺理解能力,觀察AI能否辨認(rèn)出、反駁虛假陳述的圖像;三是考驗(yàn)動(dòng)態(tài)決策能力,何時(shí)施壓、出示證據(jù)或隱瞞,AI需要在有限的試錯(cuò)次數(shù)內(nèi)做出正確的選擇。
而最終,AI也的確僅依靠自身的推理能力,就能夠表現(xiàn)出了接近人類的理解和處理問題能力。
AI能理解證詞中的漏洞,自主決定打開菜單、出示證物
在打游戲這件事上,AI顯然變得越來越聰明了。
五個(gè)月前,在《精靈寶可夢(mèng) 紅/綠》的測(cè)試中,Claude 3.0 Sonnet還沒法走出真新鎮(zhèn),如今迭代過的Claude 3.7 Sonnet,已經(jīng)能在游戲中完成超過30000次互動(dòng),并自主擊敗三位道館館長(zhǎng)。可以想見,OpenAI通關(guān)《逆轉(zhuǎn)裁判》大概也只是時(shí)間問題。
Claude 3.7 Sonnet玩《精靈寶可夢(mèng) 紅/綠》的數(shù)據(jù)
X軸為交互次數(shù),y軸為進(jìn)度成就,包括收集道具、抵達(dá)區(qū)域或擊敗BOSS
武能架槍丟手雷,文能拍桌喊異議,隨著AI特定游戲走向跨游戲泛用,或許在不久的未來,我們真能擁有一個(gè)全能的AI隊(duì)友,既能在FPS里“指哪打哪”,又能一起在RPG里推理解謎,不拖后腿、不吵架、不掉線,最重要的是——永遠(yuǎn)不會(huì)放你鴿子。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.