去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙擊。
今年攻守之勢異也。
前幾天 OpenAI 透露 GPT-5 將 All in One,集成各種產品。剛剛,Google 就把這個思路貫徹到 I/O 大會,直接掏出了自家有史以來最強的 AI 全家桶。
從發布 Gemini 2.5 Pro 與 Flash 兩款模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向開發者與創作者的 AI 套件等,Google 幾乎把從模型到產品的路徑都壓縮到一場發布會里。
更準確地說,當下最火的 AI 應用場景,都被 Google「預埋」進了產品接口里,讓人意識到它仍是全球最具工程實力和生態整合能力的 AI 巨頭之一。
也難怪許多網友調侃,將近兩個小時的發布會過后,又將有一大批初創公司死于 Google 之手。
不過,也不難看出,發布會上有一些功能仍停留在「預告片」和小范圍測試階段,距離真正的落地或許還有不小的距離。
幫我「買票 + 找座 + 填表」一口氣搞定,Google 新 AI 搜索卷瘋了
AI 正在重寫搜索這件事的底層邏輯。
在去年的 I/O 大會上,Google 推出了 AI 概覽(AI Overviews)功能,至今已擁有超過 15 億的月活躍用戶。
生成式 AI 逐漸改變了人們的搜索方式,但隨之而來的卻是,我們不再滿足于在搜索框里輸入簡單的問題,而是拋出更復雜、更長、更具多模態的提問。
今天,Google 再次加碼搜索與 AI 的融合,推出一種端到端的 AI 搜索體驗——AI Mode。
正如 Google CEO 桑達爾·皮查伊介紹的那樣,這是 Google 有史以來最強大的 AI 搜索形態,不僅具備更先進的推理能力和多模態理解能力,還支持通過上下文追問和網頁鏈接進行深度探索。
例如,當用戶面對一個需要復雜解讀的搜索問題,AI Mode 可啟動「深度搜索」機制,不同信息之間進行推理,并在幾分鐘內生成一份專家級的引用報告,為你節省數小時的研究時間。
與此同時,Google 也將 Project Astra 的多模態能力接入搜索,進一步提升搜索的實時交互性。通過 Search Live 功能,用戶只需打開攝像頭,即可通過畫面實時提問并獲得反饋。
今年是 Agent 元年,Google 也很貼心地推出了 Project Mariner Agent 功能,能幫助用戶更高效地完成任務。
例如,只需一句「幫我找兩個這個周六比賽的實惠票,位于下層座位」,AI Mode 便能自動跨多個票務平臺檢索選項,實時比較價格和庫存,并完成表單填寫等繁瑣操作,大幅提升效率。
借助 Gemini 模型和 Google 購物圖譜的強大支持,Google AI Mode 能夠幫助你縮小商品范圍并提供靈感。如果你想看看衣服穿在自己身上的效果,只需要上傳一張自己的照片,就能實現虛擬試穿衣服。
此外,AI Mode 也具備強大的個性化能力,能根據用戶上下文偏好給出定制化建議,還可生成圖表和可視化結果,尤其在體育和金融類搜索中表現出色。
該功能今日起已在美國全面上線,未來將推廣至更多地區。
會寫代碼、還省 Tokens,Gemini 2.5 拿到「學霸」人設
在模型能力方面,Google 此次發布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上獨占鰲頭。
現在,Gemini 2.5 Pro 引入了名為「Deep Think」的推理增強模式。這項功能可在生成答案前考慮多個假設,從而更深入地理解問題背景。
2.5 Pro Deep Think 在 2025 年美國數學奧林匹克(USAMO)以及 LiveCodeBench(編程基準)排名領先,并在 MMMU(測試多模態推理)中獲得了 84.0% 的分數。
不過,Google 表示,將會花更多時間進行前沿安全評估,并征求安全專家的進一步意見。作為第一步,Deep Think 功能目前將通過 Gemini API 向小范圍測試者開放。
同樣得到升級的還有注重效率的 Gemini 2.5 Flash。
新版 2.5 Flash 在推理、多模態、代碼和長上下文等關鍵基準上都有了改進,同時在效率上更高,評估中使用的 tokens 減少了 20% 至 30%。
2.5 Flash 現已在 Gemini 應用程序中向所有人開放,并將在 6 月初通過 Google AI Studio 面向開發者和 Vertex AI 向企業全面發布。
開發者體驗上,2.5 Pro 和 2.5 Flash 將在 Gemini API 和 Vertex AI 中引入了「思維摘要」功能,可將模型的推理路徑以標題、關鍵信息和調用工具等方式進行結構化呈現。
開發者也將從中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,讓開發者可以輕松接入更多開源工具和插件生態。
音樂、電影、圖像全套上線,Google 把 AI 玩出了花
本次發布會,Google 帶來了新一代圖像和視頻模型——Veo 3 和 Imagen 4。
與傳統視頻生成不同,Veo 3 是一款支持音頻的視頻生成模型,能在城市街景中模擬交通、鳥鳴,甚至角色對話,顯著提升沉浸感。
該模型不僅在文本和圖像提示的基礎上生成視頻,還能精確實現物理環境與口型同步,極大提升了視頻創作的真實感。
目前,Veo 3 已在 Gemini 應用和 Flow 平臺上向 Ultra 訂閱用戶開放,并已在 Vertex AI 平臺上為企業用戶提供支持。
上文提到的 Flow 正是 Google 為創作者打造的一款 AI 電影制作工具。
用戶只需用自然語言描述電影場景,即可管理演員、地點、道具和風格,自動生成敘事片段。Flow 已在美國向 Gemini Pro 和 Ultra 用戶開放,全球范圍的推廣也在推進中。
在圖像生成方面,新版 Imagen 4 提升了精度與速度,細節表現上可逼真展現織物、水滴與動物毛發,同時也能生成偏抽象類型的風格。
它支持 2K 分辨率和多種長寬比生成,在排版和拼寫方面也有顯著優化,適合制作賀卡、海報甚至漫畫。
Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上線,據悉,未來還將推出速度快十倍的版本。
在音樂創作方面,Google 擴大了 Lyria 2 驅動的 Music AI Sandbox 的訪問權限,并上線了互動式音樂生成模型 Lyria RealTime。該模型現已通過 API 和 AI Studio 向開發者開放。
考慮到由 Veo 3、Imagen 4 和 Lyria 2 生成的內容將繼續帶有 SynthID 水印,Google 發布了全新的 SynthID Detector。
用戶只需上傳文件,即可識別其中是否包含 SynthID 水印,用于防偽和追蹤 AI 內容來源。
Google 要造「世界模型」,連任務都能幫你做了?
Google 希望將 Gemini 打造成一個「世界模型」,既能計劃、理解,也能模擬現實世界的各個方面。
Google DeepMind CEO Demis Hassabis 表示,這一方向正是 Project Astra 的核心理念之一。
過去一年里,Google 已將視頻理解、屏幕共享、記憶功能等逐步集成進 Gemini Live。如今,Gemini 新的語音輸出加入了原生音頻,更加自然;記憶與 computer use 能力也同步增強。
此外,Google 還在探索如何利用 Agent 能力幫助人們處理多任務。
Project Mariner 就是其中之一,能夠同時完成最多十項任務,比如信息查詢、預訂、購物與調研。已面向美國 Ultra 用戶開放,并即將集成至 Gemini API 與其他核心產品中。
AI 新功能扎堆發布,會誕生真正的殺手锏嗎
NotebookLM 官方昨日宣布,上線 24 小時就已經成為 App Store 中排名第 2 的生產力應用和第 9 的整體應用。
作為 Google 在 AI 筆記工具上的一次重要探索,NotebookLM 提供音頻概覽和思維導圖等功能。
其中,音頻概覽目前已支持超過 80 種語言,而本周,Google 也宣布將為這一功能引入更高的可定制性,用戶可根據需要選擇摘要的長度,無論是快速瀏覽還是深入閱讀都不在話下。
這項功能首先將在英語中推出,隨后將擴展到更多語言。
與此同時,Google 也在回應用戶對視覺呈現的訴求,即將在 NotebookLM 中加入視頻概覽功能,用戶只需一鍵即可將筆記內容轉化為教育類視頻,用更直觀的方式傳遞信息。
在 AI 編程領域,Google還帶來了 Jules 的最新進展。
這個最初出現在 Google Labs 的自主編碼助手,能夠理解代碼并自主完成諸如編寫測試、構建功能和修復 Bug 等開發任務,如今已經正式進入公開 Beta 測試階段。
此外,Google 還推出了全新的訂閱服務 Google AI Ultra。
該計劃為專業用戶提供 Google 最強大模型和高級功能的無限制訪問,適合電影制作人、開發者、創意工作者等專業人士,月費為 249.99 美元。
目前,該計劃已經在美國上線,并將很快擴展至其他國家。
實際上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一個能嵌入日常生活、真正打進主流用戶心智的「殺手級產品」。
Google 當然明白這個道理,也正全力以赴尋找答案。
因此,我們看到,在這次的發布會上,Google 幾乎什么都做了,也什么都提了:從文本、圖像、視頻、音樂,到搜索、Agent、創作工具,一應俱全。
牌已經亮完,技術也到位,現在,Google 只差一記真正擊中用戶痛點的落子。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.