Google今天發布了 Gemini 2.5 Pro 的“升級預覽版”,并將在未來幾周內全面上市。此版本模型更新基于上個月發布的 2.5 Pro I/O 版本 (05-06),帶來了編程能力升級。如今,06-05 在 AIDER Polyglot 等基準測試中繼續保持了這種領先優勢,同時在“GPQA 和 Humanity's Last Exam (HLE)”——這些極具挑戰性的基準測試中,評估模型的數學、科學、知識和推理能力——也取得了頂級表現。
與此同時,Google指出,今天 06-05 在“LMArena 上的 Elo 分數躍升 24 分”,達到 1470 分,而在“WebDevArena 上的 Elo 分數躍升 35 分,達到 1443 分”。
在最近幾次模型升級中,一些人注意到編程之外的性能有所下降,尤其是與03-25相比。Google現在正在通過改進“樣式和結構”來解決這一反饋,以便 Gemini 2.5 Pro“能夠通過格式更好的響應更具創造力”。
Gemini 2.5 Pro 模型更新目前仍處于預覽階段,但您可以期待“幾周后”正式發布并發布穩定版本。它現已通過 Google AI Studio 和 Vertex AI 推送至 Gemini API,開發者能夠根據預算控制成本和延遲(正如2.5 Flash 中引入的那樣)。Gemini 應用今天也將獲得 2.5 Pro 預覽版升級。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.