出品|網(wǎng)易科技《態(tài)度》欄目
作者|袁寧 丁廣勝
發(fā)自山景城海岸線圓形劇場(chǎng)Google I/O大會(huì)
“我聽(tīng)說(shuō)今天是雙子星季(Gemini Season)的開(kāi)始,”Sundar Pichai 一上臺(tái)就拋出冷笑話,“但我不明白這有什么特別的。在谷歌,每天都是雙子星(Gemini)季。”
2025年 Google I/O 主題演講剛一開(kāi)場(chǎng),Pichai 就用 Gemini 做了個(gè)梗,引得全場(chǎng)輕笑。
5月20日的山景城,氣氛熱烈,網(wǎng)易科技排隊(duì)一小時(shí)擠進(jìn)會(huì)場(chǎng)前排,和來(lái)自全球的開(kāi)發(fā)者、分析師、媒體一同見(jiàn)證這場(chǎng)發(fā)布。
而就在 I/O 開(kāi)幕前,微軟才剛剛開(kāi)了 Build,大張旗鼓講“AI Agent”;而蘋(píng)果也官宣 WWDC 定檔6月。
壓力之下,谷歌也不再藏牌:升級(jí)后的 Gemini 2.5系列模型、全新圖像與視頻生成模型 Veo3和 Imagen4、音樂(lè)模型Lyria2,AI 電影制作工具 Flow,備受關(guān)注的Android XR,甚至連 AI 虛擬試衣和 Gmail 智能回復(fù)都安排上了。
一句話:Gemini 正以“操作系統(tǒng)”的姿態(tài),全面融入谷歌的生態(tài),進(jìn)入我們的日常設(shè)備與工作流程中。
發(fā)布會(huì)臨近結(jié)束,谷歌在屏幕上打出“AI 提及次數(shù):92”這一數(shù)字,現(xiàn)場(chǎng)再次爆發(fā)出笑聲。
去年,這個(gè)數(shù)字是120,堪稱“AI 爛大街”的笑話起點(diǎn)。而今年的減少,不僅是一種克制,也是一種信號(hào):AI 不是用來(lái)說(shuō)的,而是要落在產(chǎn)品里的。
01 Gemini 2.5再進(jìn)化:速度快、推理強(qiáng)、會(huì)操作電腦
不出意料,Sundar Pichai 一上來(lái)就把焦點(diǎn)交給了 Gemini。
他強(qiáng)調(diào)最新的 Gemini 2.5 Pro 表現(xiàn)搶眼,是“基準(zhǔn)測(cè)試中的頂級(jí)選手”,“在 Cursor 上增長(zhǎng)最快” “性價(jià)比最高。”
這次 Gemini 2.5系列更新的重點(diǎn)有三:
首先,原生支持音頻生成,不再只是圖文視頻那一掛,語(yǔ)音領(lǐng)域也安排上了。
其次,推出一項(xiàng)名叫“Deep Think”的實(shí)驗(yàn)性增強(qiáng)推理模式,模型不再是一拍腦門地回答,而是“多想一步”,并列出多個(gè)假設(shè)之后再輸出結(jié)果,尤其在復(fù)雜數(shù)學(xué)和編碼問(wèn)題上表現(xiàn)亮眼。
最后,具備原生電腦操作能力,開(kāi)始學(xué)會(huì)“動(dòng)手”了。
另外,開(kāi)發(fā)者體驗(yàn)也在同步升級(jí)。谷歌引入了“思維摘要”和“思維預(yù)算”功能,讓模型的推理過(guò)程更透明、也更可控。你不僅能知道它是怎么想的,還能設(shè)定它“最多想多久、想多細(xì)”。
谷歌還為 Gemini API 和 SDK 加入了對(duì) MCP 工具的支持,等于是打開(kāi)了更多開(kāi)源工具的工具箱。
02 Veo 3、Imagen 4、Lyria 2齊發(fā),F(xiàn)low直接讓你拍電影
這次谷歌的多模態(tài)生成模型更新,顯然是奔著“全棧AI創(chuàng)作者工具箱”來(lái)的。
發(fā)布會(huì)一口氣講完三大主角:Veo 3、Imagen 4、Lyria 2,外加一款新工具 Flow,試圖把創(chuàng)作這件事變成“一句話起片”的全流程自動(dòng)化。
視頻生成模型Veo 3接棒了 Veo 2的位置,還加上了與之相配的配樂(lè):從街道喧囂到鳥(niǎo)叫蟲(chóng)鳴,甚至能讓角色開(kāi)口說(shuō)話,口型對(duì)得也很準(zhǔn)。
而且它還強(qiáng)調(diào)理解能力:你在提示里講一個(gè)簡(jiǎn)短小故事,它會(huì)給你剪出一段完整、有節(jié)奏感的鏡頭內(nèi)容。也就是說(shuō),它不只是拼圖,而是開(kāi)始“導(dǎo)演”了。
目前,Veo 3已面向美國(guó)的 Gemini Ultra 用戶開(kāi)放,也能在企業(yè)級(jí) Vertex AI 中使用。
其次是圖像生成模型Imagen 4,主打兩個(gè)字:清晰。
水珠、毛發(fā)、織物細(xì)節(jié)一個(gè)不少,連拼寫(xiě)排印都照顧到了,賀卡、海報(bào)甚至漫畫(huà)都能直接生成。分辨率最高能到2K,適合商用輸出場(chǎng)景;風(fēng)格上,既能寫(xiě)實(shí)也能玩抽象,靈活度不低。
后面谷歌還要推出一個(gè)“加速版”,聲稱比 Imagen 3快10倍,趕圖黨們可以期待。
Imagen 4已接入 Gemini 應(yīng)用、Workspace 的 Slides、Vids、Docs 等產(chǎn)品,走的依然是“平臺(tái)+場(chǎng)景一體化”路線。
音樂(lè)方面,谷歌悄悄擴(kuò)大了對(duì) Lyria 2的開(kāi)放權(quán)限。雖然沒(méi)大張旗鼓,但這套系統(tǒng)依舊是業(yè)內(nèi)最頂尖的 AI 音樂(lè)生成模型之一。
而最有趣的是 Flow——這款看起來(lái)像是AI導(dǎo)演助手的工具,背后集成了 Veo、Imagen 和 Gemini 的能力。你可以用一句話描述場(chǎng)景,然后 Flow 來(lái)幫你安排演員、布置場(chǎng)景、選風(fēng)格,最后剪出一段完整視頻。它不僅是一個(gè)“生成器”,更是一個(gè)創(chuàng)作流程管理平臺(tái)。
Flow 目前只在美國(guó)區(qū)對(duì) Pro 和 Ultra 訂閱者開(kāi)放,谷歌表示“很快全球上線”——這話我們聽(tīng)過(guò)很多次了。
值得一提的是,會(huì)前的媒體溝通會(huì)上,谷歌表示未來(lái)生成內(nèi)容依舊會(huì)帶有 SynthID 水印。并透露,谷歌已經(jīng)給超過(guò)100億張圖片、視頻、音頻和文本打上了這枚“AI身份標(biāo)簽”。
03 AI 模式成Google搜索的未來(lái),一鍵試衣購(gòu)物
搜索,是谷歌的“祖?zhèn)髦鳂I(yè)”,也是AI時(shí)代最不能輸?shù)年嚨亍?/p>
這一次,谷歌不再只是“在搜索里加AI”,而是讓AI變成搜索本體,推出的 “AI 模式”,將Gemini 正式納入搜索欄。
該更新將于周三開(kāi)始向年滿18歲的英語(yǔ)用戶推出,但僅限于每月20美元的 Google AI Pro 或每月250美元的 Google AI Ultra 訂閱用戶,以及 Chrome Beta、Dev 和 Canary 用戶。
購(gòu)物是此次 AI 搜索升級(jí)中的另一大亮點(diǎn)。
谷歌將 Gemini 與自家的商品圖譜(Shopping Graph)打通,結(jié)合500億+ 商品數(shù)據(jù)源和評(píng)論系統(tǒng),讓用戶從“瀏覽靈感”一步跳轉(zhuǎn)到“理性選擇”。
最驚艷的,是“試穿功能 Try-On”。
你在搜索連衣裙時(shí)點(diǎn)擊“試穿”圖標(biāo),上傳一張自己的全身照,幾秒鐘后就能看到那件裙子穿在你身上的效果。不滿意?保存造型、發(fā)給閨蜜討論、換風(fēng)格一鍵重來(lái)。
這功能現(xiàn)在已在美國(guó) Search Labs 上線,首批支持襯衫、裙子、褲子、連衣裙等品類。
更狠的是“代理結(jié)賬”功能。你設(shè)定顏色、尺寸、預(yù)算,Gemini 會(huì)在后臺(tái)盯著價(jià)格變動(dòng),并在合適時(shí)機(jī)“替你下單”——從加入購(gòu)物車到通過(guò) Google Pay 安全結(jié)賬,全程自動(dòng)。你只需點(diǎn)擊“確認(rèn)購(gòu)買”,剩下的都交給 AI 處理。
值得一提的是,為了讓回答更“對(duì)你胃口”,谷歌宣布,AI 模式未來(lái)會(huì)引入更多用戶上下文——從搜索記錄,到 Gmail 中的航班、日程、預(yù)訂信息。
比如,你搜索“這個(gè)周末在納什維爾和朋友一起做什么,我們喜歡音樂(lè)和美食”,AI 可以結(jié)合你過(guò)去訂過(guò)哪些餐廳、飛到哪、住哪,推薦有戶外座位的餐廳,順便附帶附近的音樂(lè)活動(dòng)清單。
當(dāng)然,谷歌強(qiáng)調(diào),這些個(gè)性化信息的使用完全可控,你可以隨時(shí)開(kāi)啟或關(guān)閉,并查看 AI 是怎么用的。隱私提示也會(huì)同步出現(xiàn)。
04 Gmail、Docs、Meet,Gemini 正式接管 Google Workspace
在 Gemini 入駐搜索的同時(shí),谷歌也把這位“AI助理”帶入了每一位打工人的日常——Gmail、Docs、Meet。
這一輪 Workspace 升級(jí),關(guān)鍵詞只有一個(gè):自動(dòng)完成你懶得做的事。
在Gmail里,Gemini 可以學(xué)習(xí)你給特定聯(lián)系人、群組的郵件風(fēng)格,自動(dòng)回信;你還可以指示 Gemini 刪除特定發(fā)件人在某時(shí)間段內(nèi)的郵件;而如果 AI 檢測(cè)到你在郵件中試圖約時(shí)間,它還會(huì)自動(dòng)彈出一個(gè)會(huì)議窗口推薦時(shí)間段,連跳轉(zhuǎn) Google Calendar 的步驟都省了。
Docs 則加入了一個(gè)對(duì)專業(yè)用戶非常實(shí)用的新功能:基于來(lái)源的寫(xiě)作輔助。你可以預(yù)設(shè)信息來(lái)源,比如某份 PDF、某篇網(wǎng)文,Gemini 就只從你指定的材料中提取觀點(diǎn)和數(shù)據(jù)進(jìn)行寫(xiě)作建議,不再“自作聰明”引用外部網(wǎng)絡(luò)。該功能將于下季度正式開(kāi)放。
Meet 將支持幾乎實(shí)時(shí)的語(yǔ)音翻譯功能。你用中文發(fā)言,聽(tīng)眾就能同步聽(tīng)到英文版;你講法語(yǔ),Gemini 實(shí)時(shí)幫你轉(zhuǎn)成德語(yǔ)。這項(xiàng)功能將優(yōu)先向 AI Pro 和 Ultra 訂閱者開(kāi)放。
05 Google Ultra 版本登場(chǎng),月費(fèi)249.99美元
與 OpenAI 和 Microsoft 的訂閱模式類似,谷歌也發(fā)布了Google AI Ultra:目前定價(jià)為249.99美元/月,先在美國(guó)上線,未來(lái)將擴(kuò)展至更多國(guó)家。
Ultra 版到底值不值?來(lái)看它給了哪些特權(quán):
Ultra 計(jì)劃包括 Google 的最高速率限制、搶先體驗(yàn)即將推出的實(shí)驗(yàn)性 AI 產(chǎn)品,如 Project Mariner、Veo 3和具有深度思考模式的 Gemini 2.5 Pro。
從商業(yè)視角看,它是 Google 首次系統(tǒng)化出售“前沿大模型使用權(quán)”。
釋放的信號(hào)是:Gemini 不是玩具,而是你可以為之付費(fèi)的核心工作力。
下一步要看的則將是,在 GPT-4o 推出免費(fèi)化后,谷歌的“高價(jià)模型訂閱”路線,是否能贏得專業(yè)用戶的青睞。
06 Starline 項(xiàng)目更名為 Google Beam,Android XR也亮相了
幾年前,Google 曾用 Project Starline 掀起視頻通信革命。它不是一個(gè)會(huì)議工具,而是一個(gè)顛覆性的構(gòu)想 —— 用 AI 和光場(chǎng)技術(shù),把枯燥的遠(yuǎn)程會(huì)議變成“仿佛就在你面前”的3D 面對(duì)面交流體驗(yàn)。
Project Starline 是一條獨(dú)立于 Gemini、搜索、Android 之外的產(chǎn)品路線,更多代表的是 Google 對(duì)“未來(lái)人機(jī)交互方式”的長(zhǎng)期押注。
如今,這個(gè)曾經(jīng)看起來(lái)“黑科技”十足的研究項(xiàng)目迎來(lái)了正式產(chǎn)品化:Project Starline 更名為 Google Beam,并將在今年正式走入企業(yè)市場(chǎng)。
此外,在經(jīng)歷了十年從 Google Glass 到實(shí)驗(yàn)性原型的技術(shù)摸索后,Google 終于在今年 I/O 大會(huì)上首次展示了真正意義上的Android XR 智能眼鏡設(shè)備形態(tài)。
過(guò)去幾個(gè)月,Android XR 作為系統(tǒng)層方案已經(jīng)低調(diào)發(fā)布,旨在統(tǒng)一 Google 的 XR/VR 設(shè)備體驗(yàn)。而現(xiàn)在,Google 把 Android XR 拓展到智能眼鏡,將 Gemini 融入現(xiàn)實(shí)世界視角中,打造出日常可穿戴的 AI 助理。
谷歌表示將與創(chuàng)新眼鏡品牌合作,首批合作伙伴包括 Gentle Monster 和 Warby Parker。與此同時(shí),還將深化與三星的合作,將 Android XR 的應(yīng)用范圍從頭戴式設(shè)備擴(kuò)展到眼鏡。
以上就是本次發(fā)布的主要內(nèi)容。發(fā)布會(huì)結(jié)束,隨著人流走出會(huì)場(chǎng),大家在討論Android XR、Veo3、Google Beam,耳邊還回響著最后一句話:
“幾十年的研究,正在成為現(xiàn)實(shí)。”Pichai 的聲音沉穩(wěn),沒(méi)用大詞,也沒(méi)許諾奇跡。
這不是一場(chǎng)靠驚艷取勝的發(fā)布會(huì),但如果你問(wèn),哪家 AI 公司最可能讓十億人每天用上 AI——我想,這一刻,我在山景城現(xiàn)場(chǎng),看見(jiàn)了答案。