- 01 谷歌正式發布了Gemini 2.5 Pro和2.5 Flash的穩定版本,并全面開放使用。同時還推出了全新的預覽版模型——Gemini 2.5 Flash-Lite,這是迄今為止成本效益最高、速度最快的2.5模型。
- 02 2.5 Pro和Flash穩定版的推出,旨在幫助開發者安心構建生產級應用。新增的2.5 Flash-Lite預覽版,則在代碼、數學、推理等多項基準測試中優于2.0版本,尤其適合翻譯、分類等高并發、對延遲敏感的任務。
- 03 同時,谷歌調整了2.5 Flash的定價結構,旨在解決此前“思考”與“非思考”兩檔定價給開發者帶來的困惑。
6月18日消息,谷歌周二宣布對其Gemini 2.5模型家族進行更新。根據公告,Gemini 2.5 Pro和Gemini 2.5 Flash模型已進入穩定版本并全面開放使用。同時,該公司還發布了一款新的預覽版模型——Gemini 2.5 Flash-Lite,并調整了2.5 Flash模型的定價結構。
主要更新情況
Gemini 2.5 Flash-Lite (預覽版)
定位:該系列中“延遲最低、成本最低”的模型,被描述為對1.5及2.0版本Flash模型的經濟型升級。尤其適合大規模分類、摘要等高吞吐量任務。
功能:具備“思考”能力,但與其他模型不同,該功能默認關閉以優化成本和速度,可通過API參數啟用。
Gemini 2.5 Flash (穩定版)
狀態:現已進入穩定版本,與05-20預覽版一致。
定價調整:
輸入成本從每百萬Tokens 0.15美元上調至0.30美元。
輸出成本從每百萬Tokens 3.50美元下調至2.50美元。
取消了“思考”與“非思考”的兩檔價格區分,采用統一價格。
兼容性:該公司稱,盡管進行了價格調整,該模型依然提供業內最優的“智能成本比”。
Gemini 2.5 Pro (穩定版)
狀態:現已進入穩定版本,與06-05預覽版一致。
應用情況:據稱其增長和需求強勁,已成為眾多主流開發者工具的核心引擎,包括Cursor、Bolt、GitHub、Replit和Zed Industries等。
以下是谷歌兩篇公告全文:
【我們正在擴展Gemini 2.5模型家族】
我們設計Gemini 2.5,旨在打造一系列混合推理模型(hybrid reasoning model),不僅具備卓越性能,還能在成本與速度之間實現帕累托最優(Pareto Frontier)。今天,我們正式發布2.5 Pro和2.5 Flash這兩款穩定版本,并全面開放使用。同時,我們還帶來了全新預覽版——2.5 Flash-Lite,這是迄今為止成本效益最高、速度最快的2.5模型。
2.5 Flash和2.5 Pro全面開放
感謝大家的反饋,2.5 Flash與Pro現已推出穩定版,助力你們安心構建生產級應用。像Spline和Rooms這樣的開發者,以及Snap和SmartBear等企業,過去幾周已經在生產環境中使用了這些最新版本。
全新Gemini 2.5 Flash-Lite預覽版
我們還同步推出了Gemini 2.5 Flash-Lite的預覽版。這是我們目前成本效益最高、速度最快的2.5模型。你現在就可以開始基于該預覽版進行開發,期待收到你的反饋。
2.5 Flash-Lite在代碼、數學、科學、推理和多模態基準測試中,整體質量優于2.0 Flash-Lite。它在翻譯、分類等高并發、對延遲敏感的任務上表現尤為出色。相比2.0 Flash-Lite和2.0 Flash,在大樣本測試中延遲更低。該模型還具備Gemini 2.5系列的全部核心能力,包括可按不同預算靈活調用的推理能力、與Google搜索及代碼執行等工具的連接、多模態輸入,以及100萬token的上下文長度。
更多關于Gemini 2.5系列模型的詳細信息,請參見最新Gemini技術報告。
圖:Gemini 2.5 Flash-Lite基準測試表Gemini 2.5 Flash-Lite預覽版現已在Google AI Studio和Vertex AI上線,可與2.5 Flash和Pro的穩定版一同使用。2.5 Flash和Pro也可通過Gemini應用訪問。我們還為搜索引擎帶來了定制版的2.5 Flash-Lite和Flash。
我們非常期待看到你們基于Gemini 2.5持續創造的成果。
【Gemini 2.5:思考型模型家族的最新進展】
(易句)今天,我們非常高興為大家帶來Gemini 2.5模型家族的全線更新內容:
- Gemini 2.5 Pro現已全面上線并進入穩定版本(與06-05預覽版一致,無變動);
- Gemini 2.5 Flash現已全面上線并進入穩定版本(與05-20預覽版一致,無變動,定價調整見下文);
- Gemini 2.5 Flash-Lite現已開放預覽版。
Gemini 2.5系列為“思考型模型(thinking model)”,能夠在生成回復前自主推理思考,從而提升性能與準確性。每款模型都可靈活設置“思考預算(thinking budget)”,開發者可根據需求決定模型在生成回復前“思考”的時機與強度。
圖:Gemini 2.5思考型模型家族概覽
全新Gemini 2.5 Flash-Lite預覽版
我們今天推出了2.5 Flash-Lite預覽版,這是2.5系列中延遲最低、成本最低的模型。它面向對成本敏感的場景,是對1.5及2.0版本Flash模型的經濟型升級。2.5 Flash-Lite在多數評測中表現更優,首token響應更快,解碼速度(每秒生成token數)也顯著提升。該模型尤其適合大規模分類、摘要等高吞吐量任務。
2.5 Flash-Lite同樣是一款推理模型,允許通過API參數動態調控“思考預算”。由于Flash-Lite對成本和速度進行了優化,與其他模型不同,“思考”功能默認為關閉。2.5 Flash-Lite還支持所有原生工具,包括基于Google搜索的事實校驗(Grounding)、代碼執行、URL上下文及函數調用等功能。
圖:Gemini 2.5 Flash-Lite基準測試
Gemini 2.5 Flash及定價調整
過去一年,我們的研究團隊在Flash模型系列上持續推進帕累托前沿(Pareto Frontier)。2.5 Flash最初發布時,2.5 Flash-Lite的能力尚未最終確定。我們當時還采用了“思考”與“非思考”兩檔定價,導致開發者產生困惑。
隨著Gemini 2.5 Flash穩定版上線(即Google I/O期間提供的05-20預覽版),并憑借2.5 Flash的卓越性能,我們對2.5 Flash定價進行了如下調整:
- 輸入:0.30美元/百萬tokens(從0.15美元上調)
- 輸出:2.50美元/百萬tokens(從3.50美元下調)
- 取消了“思考”與“非思考”兩檔價格的區分
- 無論輸入token數量多少,均采用統一價格檔位
我們始終努力在預覽版與穩定版間保持價格一致,以減少用戶遷移成本。本次調整是針對Flash模型出色性價比的特殊優化,依然提供業內最優的“智能成本比”。
有了Gemini 2.5 Flash-Lite,無論是否開啟“思考”功能,我們都能為對成本和延遲極為敏感、對模型智能要求相對較低的場景,提供更低價的選擇。
圖:Gemini Flash系列定價更新
若你仍在使用Gemini 2.5 Flash Preview 04-17,原有預覽定價將持續有效,直至該模型于2025年7月15日下線。屆時,該模型終端將關閉。你可遷移至正式版“gemini-2.5-flash”,或選擇2.5 Flash-Lite預覽版作為更經濟的替代方案。
Gemini 2.5 Pro持續增長
Gemini 2.5 Pro的增長和需求強勁,遠超我們以往任何一款模型。為了讓更多客戶能夠在生產環境中使用這款模型,我們將06-05版本定為穩定版,并延續此前的帕累托最優定價。
在對智能和能力要求最高的場景,如代碼生成、智能體任務等,Pro的優勢尤為突出。Gemini 2.5 Pro已成為眾多主流開發者工具的核心引擎。
圖:主流開發者工具已集成Gemini 2.5 Pro,包括Cursor、Bolt、Cline、Cognition、Windsurf、GitHub、Lovable、Replit和Zed Industries等
如果你正在使用2.5 Pro Preview 05-06,該模型將持續可用至2025年6月19日,屆時將被關閉。若你已在使用2.5 Pro Preview 06-05,僅需將模型字符串更新為“gemini-2.5-pro”即可。
我們期待2.5 Pro的智能能力惠及更多行業場景,并將在不久的將來分享更多Pro系列擴展的最新進展。
(本文由AI翻譯,網易編輯負責校對)