【太平洋科技快訊】5月21日,谷歌在Google I/O 2025開發(fā)者大會上,公布了其Gemini 2.5系列大模型的最新進(jìn)展。該系列包含兩款模型:輕量級的Gemini 2.5 Flash和功能更強(qiáng)大的Gemini 2.5 Pro。據(jù)悉,Gemini 2.5 Flash將于6月初正式推出,而Gemini 2.5 Pro則將在后續(xù)發(fā)布。
Gemini 2.5 Flash模型在幾乎所有方面都比其前代產(chǎn)品有所提升。它將支持一項新的文本轉(zhuǎn)語音功能,能夠生成更自然的聲音,甚至可以模擬耳語效果。此外,Gemini 2.5 Flash還能夠在不同的語言之間使用同一種聲音進(jìn)行切換。
谷歌強(qiáng)調(diào),Gemini 2.5 Flash是其迄今為止最安全的模型之一,并且在效率上比上一代提升了22%,同時也更加省電。這款輕量級模型還能夠“顯示思考過程”,讓用戶看到它是如何得出答案和處理查詢的,從而提供了更多的透明度。
此外,谷歌還將推出功能更強(qiáng)大的Gemini 2.5 Pro。Demis Hassabis表示,這款模型是世界上最智能的AI模型,它能夠模擬整個城市,也是學(xué)習(xí)的領(lǐng)先模型。Gemini 2.5 Pro將迎來一種新的增強(qiáng)推理模式——“Deep Think”,以應(yīng)對更復(fù)雜的任務(wù)。但谷歌表示,Gemini 2.5 Pro不會在今天發(fā)布。相反,該公司計劃在向公眾發(fā)布之前進(jìn)行額外的安全測試,以確保模型的穩(wěn)定性和可靠性。
Gemini 2.5 Flash的一大亮點是其混合推理模式。用戶可以根據(jù)需要開啟或關(guān)閉推理能力,并設(shè)置“思考預(yù)算”來靈活調(diào)整推理深度。這種模式允許用戶在性能、成本和延遲之間找到平衡點。例如,對于簡單任務(wù),可以選擇低預(yù)算以保持低延遲和低成本;而對于復(fù)雜任務(wù),則可以選擇高預(yù)算以生成更準(zhǔn)確、全面的答案。
此外,Gemini 2.5 Flash還具備動態(tài)推理資源管理能力,能夠根據(jù)任務(wù)復(fù)雜度自動調(diào)整資源,實現(xiàn)更高效的計算。在多項基準(zhǔn)測試中,例如ME 2025和多模態(tài)推理(MMMU),Gemini 2.5 Flash都展現(xiàn)了優(yōu)異的性能,與OpenAI的o4-mini不相上下。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.