網易首頁 > 網易科技 > IT業界 > 正文

Gemini 2.5家族上新！不僅有更穩的Pro版，還帶來了史上最快最省的Lite版

2025-06-18 07:43:33　來源: 網易科技報道

北京舉報

分享至

核心提示

01 谷歌正式發布了Gemini 2.5 Pro和2.5 Flash的穩定版本，并全面開放使用。同時還推出了全新的預覽版模型——Gemini 2.5 Flash-Lite，這是迄今為止成本效益最高、速度最快的2.5模型。
02 2.5 Pro和Flash穩定版的推出，旨在幫助開發者安心構建生產級應用。新增的2.5 Flash-Lite預覽版，則在代碼、數學、推理等多項基準測試中優于2.0版本，尤其適合翻譯、分類等高并發、對延遲敏感的任務。
03 同時，谷歌調整了2.5 Flash的定價結構，旨在解決此前“思考”與“非思考”兩檔定價給開發者帶來的困惑。

6月18日消息，谷歌周二宣布對其Gemini 2.5模型家族進行更新。根據公告，Gemini 2.5 Pro和Gemini 2.5 Flash模型已進入穩定版本并全面開放使用。同時，該公司還發布了一款新的預覽版模型——Gemini 2.5 Flash-Lite，并調整了2.5 Flash模型的定價結構。

主要更新情況

Gemini 2.5 Flash-Lite (預覽版)

定位：該系列中“延遲最低、成本最低”的模型，被描述為對1.5及2.0版本Flash模型的經濟型升級。尤其適合大規模分類、摘要等高吞吐量任務。

功能：具備“思考”能力，但與其他模型不同，該功能默認關閉以優化成本和速度，可通過API參數啟用。

Gemini 2.5 Flash (穩定版)

狀態：現已進入穩定版本，與05-20預覽版一致。

定價調整：

輸入成本從每百萬Tokens 0.15美元上調至0.30美元。

輸出成本從每百萬Tokens 3.50美元下調至2.50美元。

取消了“思考”與“非思考”的兩檔價格區分，采用統一價格。

兼容性：該公司稱，盡管進行了價格調整，該模型依然提供業內最優的“智能成本比”。

Gemini 2.5 Pro (穩定版)

狀態：現已進入穩定版本，與06-05預覽版一致。

應用情況：據稱其增長和需求強勁，已成為眾多主流開發者工具的核心引擎，包括Cursor、Bolt、GitHub、Replit和Zed Industries等。

以下是谷歌兩篇公告全文：

【我們正在擴展Gemini 2.5模型家族】

我們設計Gemini 2.5，旨在打造一系列混合推理模型（hybrid reasoning model），不僅具備卓越性能，還能在成本與速度之間實現帕累托最優（Pareto Frontier）。今天，我們正式發布2.5 Pro和2.5 Flash這兩款穩定版本，并全面開放使用。同時，我們還帶來了全新預覽版——2.5 Flash-Lite，這是迄今為止成本效益最高、速度最快的2.5模型。
2.5 Flash和2.5 Pro全面開放
感謝大家的反饋，2.5 Flash與Pro現已推出穩定版，助力你們安心構建生產級應用。像Spline和Rooms這樣的開發者，以及Snap和SmartBear等企業，過去幾周已經在生產環境中使用了這些最新版本。
全新Gemini 2.5 Flash-Lite預覽版
我們還同步推出了Gemini 2.5 Flash-Lite的預覽版。這是我們目前成本效益最高、速度最快的2.5模型。你現在就可以開始基于該預覽版進行開發，期待收到你的反饋。
2.5 Flash-Lite在代碼、數學、科學、推理和多模態基準測試中，整體質量優于2.0 Flash-Lite。它在翻譯、分類等高并發、對延遲敏感的任務上表現尤為出色。相比2.0 Flash-Lite和2.0 Flash，在大樣本測試中延遲更低。該模型還具備Gemini 2.5系列的全部核心能力，包括可按不同預算靈活調用的推理能力、與Google搜索及代碼執行等工具的連接、多模態輸入，以及100萬token的上下文長度。
更多關于Gemini 2.5系列模型的詳細信息，請參見最新Gemini技術報告。

圖：Gemini 2.5 Flash-Lite基準測試表
Gemini 2.5 Flash-Lite預覽版現已在Google AI Studio和Vertex AI上線，可與2.5 Flash和Pro的穩定版一同使用。2.5 Flash和Pro也可通過Gemini應用訪問。我們還為搜索引擎帶來了定制版的2.5 Flash-Lite和Flash。
我們非常期待看到你們基于Gemini 2.5持續創造的成果。

【Gemini 2.5：思考型模型家族的最新進展】

今天，我們非常高興為大家帶來Gemini 2.5模型家族的全線更新內容：

Gemini 2.5 Pro現已全面上線并進入穩定版本（與06-05預覽版一致，無變動）；

Gemini 2.5 Flash現已全面上線并進入穩定版本（與05-20預覽版一致，無變動，定價調整見下文）；

Gemini 2.5 Flash-Lite現已開放預覽版。

Gemini 2.5系列為“思考型模型（thinking model）”，能夠在生成回復前自主推理思考，從而提升性能與準確性。每款模型都可靈活設置“思考預算（thinking budget）”，開發者可根據需求決定模型在生成回復前“思考”的時機與強度。

圖：Gemini 2.5思考型模型家族概覽
全新Gemini 2.5 Flash-Lite預覽版
我們今天推出了2.5 Flash-Lite預覽版，這是2.5系列中延遲最低、成本最低的模型。它面向對成本敏感的場景，是對1.5及2.0版本Flash模型的經濟型升級。2.5 Flash-Lite在多數評測中表現更優，首token響應更快，解碼速度（每秒生成token數）也顯著提升。該模型尤其適合大規模分類、摘要等高吞吐量任務。
2.5 Flash-Lite同樣是一款推理模型，允許通過API參數動態調控“思考預算”。由于Flash-Lite對成本和速度進行了優化，與其他模型不同，“思考”功能默認為關閉。2.5 Flash-Lite還支持所有原生工具，包括基于Google搜索的事實校驗（Grounding）、代碼執行、URL上下文及函數調用等功能。

圖：Gemini 2.5 Flash-Lite基準測試
Gemini 2.5 Flash及定價調整
過去一年，我們的研究團隊在Flash模型系列上持續推進帕累托前沿（Pareto Frontier）。2.5 Flash最初發布時，2.5 Flash-Lite的能力尚未最終確定。我們當時還采用了“思考”與“非思考”兩檔定價，導致開發者產生困惑。
隨著Gemini 2.5 Flash穩定版上線（即Google I/O期間提供的05-20預覽版），并憑借2.5 Flash的卓越性能，我們對2.5 Flash定價進行了如下調整：

輸入：0.30美元/百萬tokens（從0.15美元上調）

輸出：2.50美元/百萬tokens（從3.50美元下調）

取消了“思考”與“非思考”兩檔價格的區分

無論輸入token數量多少，均采用統一價格檔位

我們始終努力在預覽版與穩定版間保持價格一致，以減少用戶遷移成本。本次調整是針對Flash模型出色性價比的特殊優化，依然提供業內最優的“智能成本比”。
有了Gemini 2.5 Flash-Lite，無論是否開啟“思考”功能，我們都能為對成本和延遲極為敏感、對模型智能要求相對較低的場景，提供更低價的選擇。

圖：Gemini Flash系列定價更新
若你仍在使用Gemini 2.5 Flash Preview 04-17，原有預覽定價將持續有效，直至該模型于2025年7月15日下線。屆時，該模型終端將關閉。你可遷移至正式版“gemini-2.5-flash”，或選擇2.5 Flash-Lite預覽版作為更經濟的替代方案。
Gemini 2.5 Pro持續增長
Gemini 2.5 Pro的增長和需求強勁，遠超我們以往任何一款模型。為了讓更多客戶能夠在生產環境中使用這款模型，我們將06-05版本定為穩定版，并延續此前的帕累托最優定價。
在對智能和能力要求最高的場景，如代碼生成、智能體任務等，Pro的優勢尤為突出。Gemini 2.5 Pro已成為眾多主流開發者工具的核心引擎。

圖：主流開發者工具已集成Gemini 2.5 Pro，包括Cursor、Bolt、Cline、Cognition、Windsurf、GitHub、Lovable、Replit和Zed Industries等
如果你正在使用2.5 Pro Preview 05-06，該模型將持續可用至2025年6月19日，屆時將被關閉。若你已在使用2.5 Pro Preview 06-05，僅需將模型字符串更新為“gemini-2.5-pro”即可。
我們期待2.5 Pro的智能能力惠及更多行業場景，并將在不久的將來分享更多Pro系列擴展的最新進展。