來源:機器之心 編輯:Panda
你的默認編程模型是什么?或許可以換一換了。
剛剛,Google DeepMind 發布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
其最大的進步是編程能力大幅提升,不僅在 LMArena 編程排行榜上名列第一,同時也在 WebDev Arena 排行榜上更是以顯著優勢超過了昔日霸主 Claude 3.7 Sonnet (20250219)!
不僅如此,現在用戶只需使用一個提示詞即可構建 Web 應用、游戲和模擬程序等,甚至用戶僅需提供一張手繪草圖 + 功能描述,就能得到一個帶有自己設計的 UI 的功能完備的應用。
此外,下面的視頻還展示了 Gemini 2.5 Pro (I/O edition) 的另一項能力,可以根據自然圖像生成代碼,而這些代碼可以動態表示自然圖像中內容。
自家模型更新,谷歌的多位大佬也紛紛出來站臺。
諾貝爾獎得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro (I/O edition) 已經在 Gemini APP、Vertex AI 和 Google AI Studio 中開放,并且其尤其擅長構建交互式 Web 應用,下面的演示展示了該模型根據草圖構建應用的能力。
可以看到,只需一張描述畫板應用的簡單草圖加上一句簡單的提示詞,Gemini 2.5 Pro (I/O edition) 就創建出了一個功能完備的 Web 應用。
另外,谷歌母公司 Alphabet CEO、Google AI 負責人 Jeff Dean 也都各自發布了宣傳推文。
谷歌博客表示,他們原計劃在幾周后的 Google I/O 大會上發布 Gemini 2.5 Pro Preview (I/O edition),「但由于大家對這一模型的熱情高漲,我們希望盡快將其交付到大家手中,以便人們能夠立即開始構建?!?/p>
「Gemini 2.5 Pro 的編程和多模態推理功能獲得了廣泛好評,此次更新正是基于此。除了專注于 UI 的開發之外,這些提升還擴展到了其他編程任務,例如代碼轉換、代碼編輯和開發復雜的智能體工作流。」
這些增強能力讓 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分數大幅提升:比上一版本高出147分!WebDev Arena 排行榜衡量的是人類對模型構建美觀且功能強大的 Web 應用能力的偏好。
此外,新版 Gemini 2.5 Pro 在原生多模態和長上下文方面依然強勢;它在視頻理解方面表現一流 —— 在 VideoMME 基準測試中獲得了 84.8% 的分數。
以下視頻展示了 Gemini 2.5 Pro 根據單條 YouTube 視頻生成交互式學習應用的示例,同時還給出了新舊 Gemini 2.5 Pro 的對比。
網友實測,新版 Gemini 2.5 Pro 真的行
既然是編程模型新王,網友們的測試熱情可以說被瞬間激發。隨便檢索一下互聯網,我們就能找到大量網友們分享的測試案例。
比如網友 @thenomadevel 讓 Gemini 2.5 Pro Preview (I/O edition) 用 p5.js 編寫了一個直接可玩的記憶配對游戲。
https://x.com/thenomadevel/status/1919823630143213715
DeepMind 產品設計師 Tim Bettridge 則 Vibe Code(氛圍編程)了好幾個不同的游戲和應用,比如這個看起來相當不錯的星球飛行游戲:
https://x.com/TimBettridge/status/1919847724645789721
又比如這個功能完備的書架應用:
還有一個支持 3D 瀏覽的虛擬版芝加哥藝術博物館。
更有網友用不到 20 分鐘的時間構建了一個完整的城市交通模擬器。
https://x.com/WesRothMoney/status/1919887823257108941
機器之心也做了簡單的嘗試,將我們手繪的一張動物圖片變成了一個簡單的電子寵物游戲:
看起來,Vibe Coder 們又有新選擇了。
參考鏈接:https://blog.google/products/gemini/gemini-2-5-pro-updates/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.