編輯 | 楊文
由于總被 OpenAI 搶頭條,國內網友給谷歌起了個響亮的綽號 ——AI 圈汪峰。
吃的虧太多,谷歌這次終于變聰明了。
本來 Google I/O 開發者大會得在 5 月 20 日舉行,可為了防止 OpenAI 中途截胡,谷歌不惜提前兩周祭出 Gemini 2.5 的最新版本 ——
而這個版本最大的進步在于編程能力的提升,不僅在 LMArena 編程排行榜拿下第一:
還在 WebDev Arena 排行榜上超過了 Claude 3.7 Sonnet :
舉個例子。
X 網友 @Yuchenj_UW 使用同樣的提示詞:Code simulation of water in a bucket that is rocking back and forth.(編寫模擬水桶中的水來回搖晃的代碼)分別丟給 Gemini 2.5 Pro、Claude 3.7 Sonnet 和 o3。
Gemini 2.5 Pro 的效果:
Claude 3.7 Sonnet 的效果:
o3 的效果:
這三款大模型的編程能力是個啥水平,一目了然。
有網友評論稱,經過測試發現,Gemini 2.5 Pro 處理物理系統和空間邏輯的能力也遠超 o3 或 Claude Sonnet,它似乎能夠保持更精確的約束傳播和時間一致性,尤其是在多步模擬中。
在做游戲方面,Gemini 2.5 Pro 看上去也很趁手。
有網友僅用一張參考圖片,就讓 Gemini 2.5 Pro 創建了一個類似超級瑪麗的跳躍游戲。
https://x.com/npaka123/status/1919934233981718921
還有網友把自家狗子的照片喂給 Gemini 2.5 Pro,然后輸入提示詞:Code a game based on my dog,秒變 4399 小游戲。
https://x.com/testingcatalog/status/1919802147664761069
Gemini 2.5 Pro 也能一口氣搞定一款吃豆人小游戲,用該網友的話來說,就連 o3、o4-mini 等都比不上這個輸出。
https://x.com/SaiNemani1/status/1919939076351733796
Google DeepMind 研究科學家 @jalayrac 將 Gemini 2.5 Pro 的編程能力與 Gemini 的前沿多模態視頻理解功能相結合,竟然可以將一段 YouTube 視頻轉化為 p5.js 動畫。
https://x.com/jalayrac/status/1919842485003530353
看大家玩得不亦樂乎,我們也決定上手體驗一把。
我們上傳了一張星空圖,然后輸入提示詞:
用代碼模擬這張圖片在自然環境中的典型動態行為。
雖然 Gemini 2.5 Pro 生成的夜空背景烏漆麻黑,不如原圖高級,但它在左上角生成了三個參數調整器,拖動光標即可調整旋轉速度、星星數量和閃爍強度,響應非常精準。
https://g.co/gemini/share/9fa8fc467d8a
我們借鑒了 X 網友 @chetaslua 的提示詞:
make a website to show me how the Earth was formed (scientifically believed) in 3D prompt , give full code block. 創建一個 3D 動畫網站,展示地球是如何形成的(基于科學理論),并提供完整的代碼塊。
Gemini 2.5 Pro 不僅將地球演化的 7 個階段以 3D 動畫的形式表現出來,還為了方便用戶理解附上了文字解讀。
當然,它生成的 3D 動畫還不夠精美,尤其是模擬的星球遠遠看著像個煮熟的雞蛋。
https://g.co/gemini/share/efd6a4fc980f
我們還整了個辦公室摸魚小游戲。為了讓生成效果更佳,我們請出了老搭檔 ChatGPT,讓它來寫提示詞。
請幫我生成一款適合上班摸魚時玩的 “逃生” 類網頁小游戲的代碼,要求如下:【游戲目標】 玩家需在一個虛擬辦公室場景中悄悄完成逃離任務,但不能被老板或監控發現。 玩法可以是找出口、點物品、解謎、路線規劃等,輕度策略為主。 游戲需設置一些干擾機制(如老板巡邏、攝像頭移動),增加緊張感。 【設計要求】 界面風格極簡,像素風或手繪風皆可,顏色柔和; 用戶主要通過鼠標點擊或鍵盤方向鍵控制角色或選擇操作; 頁面不要發出聲音(避免上班時暴露); 不使用服務器、不加載大圖片,適合瀏覽器本地運行; 游戲不應超過 3 分鐘即可通關,適合碎片時間玩; 可加一個 “老板來了” 按鈕,點擊后立刻切成 Excel 模板畫面(有趣的彩蛋)。
只要把以上提示詞全部復制粘貼給 Gemini 2.5 Pro,它就能輸出一堆代碼,并自動給出預覽。
玩法也很簡單,使用方向鍵移動游戲角色()到達出口 () 即可,不過要躲開老板 () 和監控探頭 () 的視線。
https://g.co/gemini/share/6d03c78e9c9f
更有趣的是,我們點擊下方的「老板來了!」按鈕,就會彈出一張 Excel 表格,里面記錄著電子牛馬們手頭干的活。
當然,和其他大模型一樣,Gemini 2.5 Pro 經常會抽風。
Transform this image into a code-based representation of its natural behavior.
Gemini 2.5 Pro 并沒有模擬出花朵綻放的效果,只是讓牡丹的莖長高了點。
最后再說個題外話。
前段時間,谷歌針對美國學生用戶推出了免費使用 Google One 會員功能。
就在昨天,谷歌突然卡 bug,活動申請頁面取消了 edu 學生郵箱等驗證的步驟。
這就意味著,普通用戶只需登錄 Google 個人賬戶,就可以免費領取 Google One 會員到 2026 年底。
成功領取后, 就可以體驗 Gemini Advanced、NotebookLM Plus、2TB Google Drive 等功能。
不過值得注意的是,這僅限美國 IP,還要使用谷歌瀏覽器。
領取地址:https://gemini.google/students/
以后我們會帶來更多好玩有用的 AI 評測,也歡迎大家進群交流。
? THE END
轉載請聯系本公眾號獲得授權
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.