今天早上看到 Google 開完了他們的 Google Cloud Next 25,發了近 20 個 AI 相關的模型、應用、開發工具、硬件。
這次發的內容特別多,很多信息散落在大量公告中。
我選了 AI 相關重點和效果演示,整理了這份全網最清晰 Google Cloud Next 25 AI 更新解讀,方便大家跟上最新進展。
先給個總結:
1. Google 公布了很多重磅、酷炫的 AI 模型與工具 ,但不少好東西都是期貨, 求谷歌快點放出來
2. Gemini 2.5 Flash 即將發布,高性價比推理。 結合此前登頂的 2.5 Pro , 能否逆襲當回 AI 界老大?
3. 特別的,發了 讓 Agent 無縫協作的 A2A 協議 ,主導全球 Agent 未來協同規范
4. 全面 公開了 Google AI 的 601 項 AI 落地案例 ,對應用層創業者指出明路。
本文共耗時 8 小時,整理了 5 個 AI 新模型、1 個面向未來的 AI 協議,以及 6 項其他重點更新。
下文提到的所有公告原文、產品體驗與 Waitlist 地址,都統一整理在文末。
5 個 AI 模型更新
首先是 5 個 AI 模型更新,我繪制了這份看板,方便大家速覽:
Gemini 2.5 Flash:快來了,是推理模型,主打快速、便宜
此前 Google 已經推出了 Gemini 2.5 Pro 推理模型,擁有 100W tokens 上下文(實測在超出上下文對話中,依舊能遵循指令,精準回憶早期對話記憶),而且支持多模態提示。在眾多 Benchmark 測試中,取得了最高排名。
確實非常厲害,目前一澤的日常主力模型就是 2.5 Pro,前幾天備受好評的中,就使用它獲得了最佳的體驗效果。
現在 Gemini 2.5 Flash 也快來了,與前代 2.0 Flash 不同的是:
- 這次是個推理模型,但依然延續了快速、便宜好用的優點
- 推理程度會根據對話任務復雜度,動態適應(不傻傻地對簡單常識問題進行長推理實在是太有必要了)
- 開發者可以自定義模型的推理程度,便于控制成本
- 正式發布還需要時間,再等等,很快在 Vertex AI 中可用
Veo 2:超一流視頻生成模型,現已開放 waitlist 申請
Veo 2 絕對是值得關注的視頻生成模型,現在還支持 P 視頻、關鍵幀生成視頻、擴展畫面、鏡頭控制等特性:
- P 視頻:無需手動修圖,移除視頻中不需要的元素。注意看,左圖是有吊威亞的,右圖的繩子就被自然 P 掉了
- 關鍵幀生成視頻:用首尾畫面(最左為首圖、最右為尾圖),生成視頻,畫面效果非常穩定
- 擴展畫面:可以對已有視頻畫面進行自然擴展,雖然效果不算特別高級,但很適合把一些橫版視頻變成豎版,方便投稿到 TikTok 等豎屏內容平臺
- 鏡頭控制:可以在視頻生成時,調整鏡頭構圖、攝像機角度和控制節奏,將攝像機向不同方向移動,創建延時攝影效果,或生成無人機跟隨風格的鏡頭。
PS:Google VideoFX 用的就是 Veo 2 模型(不得不說 Google 家的產品入口、關系是真的復雜)
注:Veo2 現已開放 waitlist 申請,申請地址請在文末獲取。
吐槽:Google Cloud 和 Vertex AI 的界面是真難用。如無必要,還是等 VideoFX 這類 to C 入口開放了再用吧
Chirp 3:只需 10 秒語音樣本,即可創建逼真的自定義語言
和 Veo 2 一起被更新到 Vertex AI 的還有 Chirp 3,是 Google 的音頻理解與生成模型。
Chirp 3 提供了超過 35 種語言(含中文)的自然逼真的語音,并支持八種音色選項。
- 亮點一:支持通過 10 秒的短錄音,就能生成非常逼真的自定義語音
- 因為 Chirp 3 現在只能通過 API 調用,所以沒能直接上手。暫時不確定用于學習的 10 秒短錄音是必須跟讀固定文本,還是隨意任何一條清晰的錄音也可以。
- 如果是后者,那就非常有意思,你可以拿游戲、動漫里的角色的任何一段音頻,合成對應的虛擬人語音(捏虛擬老婆,啊不,正經 AI 伴侶),對于開發者還是阿宅都非常有價值。
- 當然,也希望 Google 抓緊做好安全策略,以防自己的語音被別人拿去隨意合成。
- 下面是個 Chirp 3 的實際音頻效果,展示了無停頓和有停頓的語音區別,挺自然的。
- 亮點二:區分音頻中的說話人身份,提升音頻轉文本的易用性
- 天下苦音頻轉寫不能區分人聲久矣。這下好了,現在能夠區分多個說話人錄音中“哪句話是誰說的”。這也是這項技術必然的需求趨勢。
- 會議摘要、播客分析、訪談錄音轉寫會方便很多。
Lyria:文本到音樂生成模型,也開放 waitlist 申請
Lyria 也被更新到了 Vertex AI ,可從簡單文本提示創建完整音樂作品。
不過沒看出來特別的亮點,像海螺音樂的效果也不錯。
以下是官方放出的演示音頻:
看過就好。
注:Lyria 現已開放 waitlist 申請,申請地址見文末。
Imagen 3:圖像生成和編輯能力改進,更擅長對象移除和圖像修復了
Imagen 3 已經放出來很久了,就通過 ImageFX(Imagen 3)生成了很多產品、游戲、家居設計的圖像樣例。絕對是被低估的、頭一檔的文生圖模型。
一澤萬能文生圖框架,測試 Imagefx 效果
Imagen 提升了編輯/修復功能效果,能夠快速移除、重繪圖像中不需要的對象、瑕疵。
下圖是官方演示:
左圖為原圖,中間是舊版本,右圖是 Imagen3 版本
Imagen 3一如既往的穩定,實力真的被大大低估了。
你可以在 Gemini 應用、ImageFX 開始使用它。
1 個面向未來的 AI 協議
Agent 2 Agent:讓 Agent 們無縫協作的新協議
AI 開發者好不容易在 WaytoAGI 社區、AI 博主們的共學努力下,逐漸搞懂 MCP 是什么。
現在 Google 又搓出了特殊的協議—— Agent 2 Agent。
如果要看小科普,隔壁那個很快的數字肝帝已經發了,可以去看看:
大意是:
- A2A 是一種用于 Agent 與 Agent 聯動協作的開放協議,是對 Anthropic 模型上下文協議 (MCP) 的補充
- MCP 側重于為 Agent 接入各類工具與信息
- A2A 更側重讓“你要用的 Agent”(客戶端 Agent)能夠與“提供第三方支持的 Agent”(遠程 Agent)進行聯動,前者負責制定、傳達任務,后者負責執行
- 在 A2A 連接的過程中,Agent 之間可以互相發送消息,傳達上下文信息、回復等
- A2A 協議的連接,可以持續保持很久,直到完成任務
官方也給了一個演示視頻,用來看效果:
類 A2A 協議在未來 AI Agent 全面落地的時代,當然非常重要。
但不管怎么樣,在類 MCP 生態還未健全、Workflow 到底能不能算 Agent 都沒分清楚的現在,普通人甚至大部分開發者,也都沒必要過多關注 A2A 協議。
Don't be so serious.
如果你喜歡研究技術,可移步官方 Github 倉庫:https://github.com/google/A2A
? 其他 AI 應用、開發者工具和 601 個案例
除了前面的模型更新、 A2A 協議外,谷歌還面向一般用戶、開發者更新了一堆應用和開發工具,以及 601 個真實 AI 應用案例。
就挑一些重點說,按主觀優先級排列:
Firebase Studio:搭載最強 AI 的云端 AI 編程工具,支持一鍵部署應用
Google 也發布了他們自己的 AI 編程工具,得益于 Google Cloud 的云資源,開發者可以用 Firebase 一站式完成應用開發的全流程。
包括 AI coding、編譯構建、云服務部署、運行 的一切。
確實很方便,而且不需要下載 IDE,在云端就可以完成 AI 編程。
他們的首頁是這樣的。
具體的 Coding 界面長這樣,操作體驗和其他 AI 編程應用一致。
得益于最強 Gemini 2.5 Pro 的加持,你能體驗到這個星球上現在一流的 Coding 體驗。
可以前往https://idx.google.com/體驗。
ADK:Google 的新 Agent 開發框架
ADK,全稱 Agent Development Kit。也是 Google 新發布的開發框架,適用于構建 Multi-Agent 系統的開發。
以下是官方介紹的優勢:
開發者可以自行前往 https://google.github.io/adk-docs 查看具體項目
Google Workspace :集成大量 AI 服務
Google 給 Workspace 套件追加了大量的 AI 能力。
為 Docs、Sheets、Meet、Chat 等日常工具帶來更多 AI 功能:
- 可以把 Google 文檔變成音頻版本,或者用播客風格概括文檔亮點
- Google 文檔新增“幫我改進”功能
- Vids 可用 Veo2 視頻生成模型
- Sheets 支持用 AI 自動分析數據,并生成洞察
對了,普通用戶在 Google Doc 中無法體驗
Google AI Studio 整體 UI 優化
Google 這次還是沒選擇優化他們的 Google Cloud 控制臺設計,而是選擇了繼續優化 AI Studio。
整體設計風格向 Gemini Web 應用靠攏,變清晰了不少。
這算個小添頭,還不錯,用起來會更順手。
Google 的 601 個真實客戶帶來的 AI 案例
Google 更新了過去一年他們推動的 AI 客戶案例。
在去年 Google Cloud Next 24 時,這個案例列表還只有 101 個,現在已經多了 500 個。狠狠秀了一把肌肉。
用 Gemini 總結這 601 個應用場景,涉及的應用場景如下:
- 客戶代理: 提升客戶服務(如聊天機器人、個性化推薦、訂單處理)
- 員工代理: 提高員工效率(如自動化任務、信息檢索、內容生成、協作)
- 創意代理: 加速創意內容生成(如廣告、圖像、視頻、文案)
- 代碼代理: 輔助軟件開發(如代碼生成、調試、代碼庫理解)
- 數據代理: 強化數據分析和洞察(如模式識別、預測、供應鏈優化、數字孿生)
- 安全代理: 增強安全防護(如威脅檢測、欺詐預防、合規性)
相信對很多 AI 公司(尤其 To B)會有不少解決方案上的啟發。
詳細案例集在此:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
Ironwood TPU:Google 第 7 代 AI 芯片,專為推理而生
Google 即將推出他們的第 7 代 AI 芯片「Ironwood」,是他們迄今為止性能最高、可擴展性最強的定制 AI 加速器,也是首款專為推理而設計的加速器。
官方公布 Ironwood 的峰值計算性能是上代 Trillium 的 5 倍,將大幅加速 AI 推理效率。
除了以上這些外,Google 還更新了不少其他的 AI 開發小套件、解決方案。
在這里看到 Google Cloud Next 2025 的完整官方公告:https://blog.google/products/google-cloud/next-2025/
差不多就是這些內容,我最期待 Gemini 2.5 Flash ,你最期待哪個更新?
你覺得 Google 又是否能借這次 Next 25,重新當回 AI 界老大哥呢?
Ref
- 公告原文
- 【Google Cloud Next 25 官方原文大合集】:https://blog.google/products/google-cloud/next-2025
- Gemini 2.5 Flash:https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-pro-flash-on-vertex-ai
- Vertex AI - Veo 2 / Chirp 3 / Lyria / Imagen 3:https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai
- A2A:https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
- Agent Development Kit:https://developers.googleblog.com/en/agent-development-kit-easy-to-build-multi-agent-applications/
- Google Workspace:https://blog.google/products/workspace/cloud-next-2025-workspace-gemini/
- Google AI 的 601 個落地案例:
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
- Ironwood TPU:https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/
- 文內提到的可體驗內容
- Firebase Studio:https://idx.google.com/
- Google AI Studio:https://aistudio.google.com/
- Chirp 3:https://cloud.google.com/text-to-speech/docs/chirp3-hd
- Imagen 3:https://labs.google/fx/zh/tools/image-fx
- Waitlist 申請地址
- Veo 2:https://docs.google.com/forms/d/e/1FAIpQLSfdksQf4brbFzAx5l1geMx7DlBTjoZKjA4DuI3uTiETCB-0hg/viewform
- Lyria:https://docs.google.com/forms/d/1YktCIiIzyZe6TxfKnQ9PzybXGLzOeH0LJMUnhJubi1M/viewform
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.