IT之家 5 月 4 日消息,谷歌最先進的人工智能模型取得了重大突破:成功通關了一款 29 年前的電子游戲。
谷歌首席執行官桑達爾?皮查伊(Sundar Pichai)在 X 網站上興奮地宣布:“太精彩了!Gemini 2.5 Pro 剛剛完成了《寶可夢藍》!”
據IT之家了解,此次直播活動名為“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 歲軟件工程師發起,他并非谷歌員工。盡管如此,谷歌高管們對這一嘗試表示了支持。谷歌 AI Studio 的產品負責人洛根?基爾帕特里克(Logan Kilpatrick)上個月曾表示,Gemini 在完成《寶可夢》方面取得了顯著進展,并且已經獲得了第五個徽章(目前表現第二好的模型只獲得了三個徽章,不過使用的是不同的代理框架)。皮查伊還開玩笑說:“我們正在開發 API,即人工寶可夢智能。”
為何選擇《寶可夢》?早在今年 2 月,Anthropic 公司就曾強調其 Claude AI 模型在《寶可夢紅》中的表現,稱 Claude 的“深度思考和代理訓練”使其在應對“更出人意料”的任務時更具優勢,例如玩經典游戲。但 Claude 似乎尚未通關《寶可夢紅》,這是否意味著 Gemini 在游戲方面表現更勝一籌?Joel Z 在他的 Twitch 頁面上提醒觀眾:“請不要將此視為衡量大型語言模型(LLM)玩寶可夢能力的基準。兩者之間無法進行直接比較,因為 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,兩款 AI 模型都需要借助代理框架才能玩游戲。這些框架為模型提供帶有額外信息的游戲截圖,使模型能夠據此做出決策(可能涉及調用專業代理),并按下與 AI 指令相對應的按鈕。
Joel Z 承認,在幫助 Gemini 完成游戲的過程中,他確實進行了一些“開發干預”,但他強調這并非作弊。“我的干預是為了提升 Gemini 的整體決策和推理能力。我不會給出具體提示詞,也不會為特定挑戰(如月球山脈)提供攻略或直接指令。唯一接近這種情況的是,我告訴 Gemini 需要與火箭隊小兵對話兩次才能獲得升空鑰匙,這其實是一個在《寶可夢黃》中被修復的漏洞。”
他還表示:“Gemini Plays Pokémon 仍在積極開發中,其框架也在不斷演變。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.