今天,谷歌通過 Gemini API,在 Google AI Studio 和 Vertex AI 預覽中上線了 Gemini 2.5 Flash 早期版本。
Gemini 2.5 Flash 是谷歌首個完全混合式推理模型,用戶可以根據需求選擇是否開啟“思考”功能。該模型還支持開發者設置“思考預算”,用戶可以精細控制模型在思考階段最多可生成的 token 數量,找到質量、成本與延遲之間的最佳平衡。
Gemini 2.5 Flash 的輸入費用是 0.15 美元/百萬token,而輸出費用則根據是否啟用推理差異顯著:
· 關閉推理時,0.60 美元/百萬 token;
· 啟用推理時,上升至3.50 美元/百萬token。
推理輸出的近六倍價格差異反映了“思考”過程的計算強度,其中模型在生成響應之前會評估多種潛在路徑和考慮因素。
而“思考預算”可以在 0 到 24,576 個 token 之間調整,其作用是設置上限,而非固定分配。模型會根據任務復雜程度智能決定使用多少預算。
谷歌稱Gemini 2.5 Flash 在多項關鍵基準測試中表現出色。在被稱為“人類最后的考試”測試中,2.5 Flash 取得了 12.1% 的成績,超過了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新發布的 o4-mini(14.3%)。
業內人士指出,測試結果表明谷歌正在縮小與競爭對手的性能差距,同時保持價格優勢。這對關注 AI 預算的企業客戶而言,可能極具吸引力。
“Gemini Flash的炒作最少,但根據我的生產經驗,它具有最佳的性價比和多模態工具。谷歌正在默默地贏得人工智能競賽。”有網友稱。
有網友還內涵了下OpenAI:“谷歌在其 Flash 2.5 的對比中加入了 o4-mini,真是太棒了。這款型號昨天才發布,而有些公司只跟自家的型號比較。Gemini真不錯。”
還有網友道,“就我的體驗,Gemini 2.5 Pro 進步非常顯著,以至于我現在都對谷歌有了改觀。它不僅比我聰明,還不會一味地迎合我。它會在適當的時候反駁我,而非刻意扭曲自己來迎合我。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.