正如谷歌CEO皮查伊所言:“我們正進入AI平臺變革的新階段?!边@場發(fā)布會不僅是一次技術(shù)秀,更是一場關(guān)于未來十年產(chǎn)業(yè)變革的宣言——AI的戰(zhàn)場,正在從代碼與算力,轉(zhuǎn)向千行百業(yè)的真實場景。
作者|斗斗
編輯|皮爺
出品|產(chǎn)業(yè)家
在一片期待與好奇的氛圍中,谷歌I/O開發(fā)者大會如期而至,5月21日凌晨1點,于美國加州山景城的海岸線圓形劇場內(nèi)正式拉開帷幕。
不出意外的,AI依舊是今年的主題,但不同于以往,今年谷歌I/O開發(fā)者大會的熱度高的出奇,網(wǎng)友的口碑也是一片叫好。
在全球科技圈的集體注視下,這次谷歌究竟到底帶來了哪些技術(shù)升級和新產(chǎn)品?對于AI技術(shù)落地企業(yè)、行業(yè)甚至產(chǎn)業(yè)的方向,以及AI技術(shù)的走向,又傳遞了哪些訊號?
一、模型——從秀能力奔向秀落地范式
Gemini 2.5 Pro模型,是這次大會的重頭戲。
與前代模型相比,Gemini 2.5 Pro最大的突破在于引入了“動態(tài)推理架構(gòu)”。它不再是單純根據(jù)輸入數(shù)據(jù)生成答案,而是通過生成多個假設(shè)分支、模擬不同決策路徑,最終選擇最優(yōu)解。這一機制類似于人類在復(fù)雜問題前的“沙盤推演”,使AI在醫(yī)療診斷、工業(yè)質(zhì)檢等高風(fēng)險場景中的錯誤率降低。
技術(shù)突破的落地往往受制于現(xiàn)實瓶頸。
以往,制造企業(yè)長期抱怨AI模型的“黑箱特性”,例如即使模型給出錯誤判斷,工程師也難以追溯問題根源。為此,Gemini 2.5 Pro的“推理過程可視化”功能,將模型決策拆解為可解釋的邏輯節(jié)點,例如在汽車焊點質(zhì)檢中,系統(tǒng)不僅能識別缺陷位置,還會標注“因焊接溫度波動超過閾值導(dǎo)致金屬結(jié)晶率下降”等具體原因。
2025年,全球AI產(chǎn)業(yè)站在了十字路口。當(dāng)生成式AI在內(nèi)容創(chuàng)作領(lǐng)域陷入同質(zhì)化競爭時,企業(yè)對AI的期待已不再局限于“回答問題”,而是希望其成為驅(qū)動決策的“智慧大腦”。谷歌此時推出Gemini 2.5 Pro,正是回應(yīng)了這一產(chǎn)業(yè)轉(zhuǎn)型的迫切需求。
可以預(yù)見,在這一技術(shù)升級下,未來具備“決策可追溯性”的AI模型將滲透企業(yè)核心業(yè)務(wù)流程,推動AI從效率工具升級為戰(zhàn)略決策中樞。
在模型方面,谷歌還發(fā)布了Deep Think超強版以及Flash低門檻版。
Deep Think版本通過引入增強型推理機制,在數(shù)學(xué)、編程和多模態(tài)任務(wù)中實現(xiàn)“可能性預(yù)判”,顯著提升復(fù)雜場景的決策精度,其在目前最難的數(shù)學(xué)基準之一 2025 USAMO 上取得了令人印象深刻的分數(shù)。此外,還在一個針對競賽級編程的難度基準—— LiveCodeBench 上處于領(lǐng)先地位,并在測試多模態(tài)推理的 MMMU 上取得了 84.0% 的分數(shù)。
其Flash版本則專為速度和低成本而設(shè)計,以輕量化設(shè)計支持邊緣計算。數(shù)據(jù)顯示,該模型響應(yīng)速度較之前提升40%。
谷歌這種模型分層設(shè)計(云端大模型+邊緣輕量化),可以大幅解決產(chǎn)業(yè)落地中“算力-成本-實時性”的三角矛盾。
總結(jié)來說,此次Google I/O開發(fā)者大會,谷歌在模型層面不僅僅是秀能力,更多的是通過新產(chǎn)品和技術(shù)升級,推動AI真正落地場景、行業(yè)、產(chǎn)業(yè),秀的是其AI技術(shù)落地路徑。
二、AI問答助手:
可聽、可看、可操作
除了大模型方面的升級,谷歌還發(fā)布了一系列產(chǎn)品,其中Project Astra 所展示出來的多模態(tài)交互能力,讓人眼前一亮。
其技術(shù)突破在于多模態(tài)感知的深度融合:攝像頭捕捉視覺信息后,系統(tǒng)會結(jié)合麥克風(fēng)陣列的空間音頻定位、IMU傳感器的運動軌跡數(shù)據(jù),在0.1秒內(nèi)構(gòu)建出完整的環(huán)境模型。
眾所周知,AI輔助設(shè)備的核心痛點是現(xiàn)有系統(tǒng)依賴語音指令或固定閾值報警,卻無法像人類一樣感知環(huán)境動態(tài)。
谷歌Project Astra 的發(fā)布,標志著AI開始具備“具身認知”能力——它不僅能“看”和“聽”,還能理解物理空間的上下文關(guān)系,并主動采取行動。
但實現(xiàn)這一能力需要突破硬件算力的物理限制。傳統(tǒng)邊緣設(shè)備難以支撐實時視頻分析所需的算力,而Project Astra通過“動態(tài)任務(wù)卸載”技術(shù)巧妙化解了這一矛盾:低復(fù)雜度任務(wù)(如手勢識別)在本地完成,高負載任務(wù)(如3D環(huán)境建模)則通過5G網(wǎng)絡(luò)回傳云端處理。
現(xiàn)在,Gemini Live 已整合 Project Astra 的攝像頭和屏幕共享功能,并向所有 Android 用戶開放,并將于當(dāng)天開始向 iOS 用戶推出。
從更大的視角來看,該產(chǎn)品或?qū)⒑艽蟪潭壬?,改變AI助手抑或是智能終端在場景割裂(如家庭與辦公場景需切換不同設(shè)備)和被動響應(yīng)(僅回答預(yù)設(shè)問題)的局限,滿足企業(yè)級連續(xù)性需求。
三、AI搜索,
一個能完成各種任務(wù)的智能助手
此次大會上,谷歌還首次將 Gemini 2.5 Pro 深度整合至搜索引擎,推出“AI 模式”功能。
據(jù)了解,用戶可通過多模態(tài)輸入(文字、語音、圖像)直接獲取結(jié)構(gòu)化答案,而非傳統(tǒng)鏈接列表。
以規(guī)劃 “東京五日游” 為例,AI 不僅生成詳細的行程建議,還會根據(jù)用戶的預(yù)算、喜好、出行方式等個性化需求,自動推薦合適的餐廳、酒店,并提供在線預(yù)訂服務(wù),同時還能比價購票,為用戶節(jié)省時間和成本。在旅游過程中,用戶甚至可以通過攝像頭實時識別景點,獲取詳細的背景信息和歷史故事,讓旅行體驗更加豐富和有趣。
這標志著搜索引擎或?qū)膫鹘y(tǒng)的鏈接列表模式向智能化、個性化、服務(wù)化的方向全面轉(zhuǎn)型。
這與傳統(tǒng)廣告模式的底層邏輯完全不同。
在過去,廣告商主要通過購買關(guān)鍵詞廣告、展示廣告等方式吸引用戶點擊鏈接,進而實現(xiàn)品牌推廣和產(chǎn)品銷售。然而,AI 模式通過直接在搜索結(jié)果中嵌入商品推薦和 “智能結(jié)賬” 功能,為電商、本地服務(wù)等行業(yè)開辟了全新的變現(xiàn)路徑。
此外,AI 直接提供答案的模式將減少用戶跳轉(zhuǎn)第三方網(wǎng)站的需求。這一變化對內(nèi)容生產(chǎn)者提出了新的要求,倒逼他們優(yōu)化數(shù)據(jù)結(jié)構(gòu)以適應(yīng) AI 抓取,推動 SEO(搜索引擎優(yōu)化)向 “答案優(yōu)化” 轉(zhuǎn)型。內(nèi)容生產(chǎn)者需要更加注重內(nèi)容的質(zhì)量、深度和結(jié)構(gòu)化,以確保其信息能夠被 AI 準確理解和呈現(xiàn),從而在新的搜索生態(tài)中占據(jù)有利地位。
據(jù)谷歌透露,其搜索業(yè)務(wù)的 “下一站” 將是 AI 驅(qū)動的交互模式升級,用戶將體驗到更加自然、個性化的信息獲取方式,從而重構(gòu)互聯(lián)網(wǎng)流量分配規(guī)則。
未來,搜索引擎或?qū)⒉辉偈呛唵蔚男畔z索工具,而是一個能夠理解用戶意圖、提供主動服務(wù)、協(xié)助用戶完成各種任務(wù)的智能助手。這將徹底改變用戶與互聯(lián)網(wǎng)互動的方式,推動互聯(lián)網(wǎng)行業(yè)進入一個全新的發(fā)展階段,為相關(guān)產(chǎn)業(yè)帶來新的機遇和挑戰(zhàn)。
四、AI Agent——從“工具”到“同事”
Project Mariner 代理系統(tǒng)的升級也是本次大會的一大亮點。
升級后的 Project Mariner 代理系統(tǒng)可同時處理 10 項任務(wù),例如在用戶指令下自動完成 “查找食譜 → 生成購物清單 → 在線下單” 的全流程。其基于瀏覽器擴展的架構(gòu),能理解網(wǎng)頁內(nèi)容(文本、圖像、表單)并模擬人類操作。
對于企業(yè)而言,Project Mariner 在重復(fù)性流程的自動化處理方面展現(xiàn)出了巨大的價值。
在數(shù)據(jù)錄入工作中,它能夠快速準確地將大量數(shù)據(jù)錄入系統(tǒng),避免了人工操作可能出現(xiàn)的錯誤和疲勞,提高了數(shù)據(jù)處理的速度和質(zhì)量。在訂單處理方面,它可以自動跟蹤訂單狀態(tài)、更新訂單信息、安排發(fā)貨等,確保訂單的及時交付和客戶滿意度的提升,幫助企業(yè)節(jié)省運營成本。
目前,谷歌方面表示Project Mariner 的技術(shù)將通過 Gemini API 開放給開發(fā)者,而這一舉措也將進一步擴大了其生態(tài)影響力。
開發(fā)者可以基于 Mariner 的功能開發(fā)出更多符合特定行業(yè)和業(yè)務(wù)需求的應(yīng)用程序,為企業(yè)提供個性化的自動化解決方案。例如,在金融行業(yè),開發(fā)者可以利用 Mariner 的多任務(wù)處理能力和網(wǎng)頁理解能力,開發(fā)出自動化的風(fēng)險管理工具和投資分析平臺,幫助金融機構(gòu)更高效地進行市場分析、風(fēng)險評估和投資決策。
這一變革不僅提升了生產(chǎn)力效率,也為 AI 代理的商業(yè)化應(yīng)用提供了新路徑。
隨著 Mariner 技術(shù)的不斷成熟和應(yīng)用場景的不斷拓展,它將為企業(yè)和用戶帶來更多創(chuàng)新性的解決方案,推動各行業(yè)向智能化、自動化方向加速發(fā)展,進一步重塑產(chǎn)業(yè)格局和工作模式。
五、生成式AI,奔向工業(yè)化生產(chǎn)
在內(nèi)容創(chuàng)作領(lǐng)域,谷歌也帶來了一些重大突破,推出了Veo 3視頻生成模型和Imagen 4圖像生成模型。
據(jù)了解,Veo 3支持音視頻同步生成,例如為視頻添加背景音樂、音效甚至對白,解決了以往AI視頻生成中“有影無聲”的問題。
提示語:90 年代酒吧里的情景喜劇場景,背景墻上的霓虹燈寫著 “fofr”。一對夫婦說了些什么,觀眾大笑起來。
而Imagen 4的圖像生成速度比前代快10倍,分辨率達2K,細節(jié)渲染能力顯著提升。
目前,兩者均被整合至電影制作工具Flow中,支持自定義鏡頭、場景和角色動作。
開發(fā)者大會上,谷歌展示了Veo 3生成的高清視頻,其細節(jié)渲染能力接近專業(yè)電影制作水平??梢云诖氖?,在短視頻和廣告行業(yè),創(chuàng)作者未來或?qū)⒖赏ㄟ^AI快速生成高質(zhì)量素材,制作成本或?qū)⒋蠓档汀?/p>
更值得期待的是,在影視工業(yè)領(lǐng)域,F(xiàn)low工具允許導(dǎo)演用自然語言調(diào)整鏡頭語言,AI實時渲染預(yù)覽畫面,縮短制作周期,這將推動“敏捷創(chuàng)作”模式普及。
總得來看,Veo 3和Imagen 4的推出,顯然直接降低了內(nèi)容生產(chǎn)的門檻。
針對當(dāng)下生成式AI的廣泛應(yīng)用帶來的版權(quán)和倫理挑戰(zhàn),谷歌還同步推出的SynthID水印技術(shù),試圖通過技術(shù)手段解決AI生成內(nèi)容的真實性驗證問題。
這一技術(shù)不僅重塑了內(nèi)容生產(chǎn)范式,也為長尾創(chuàng)作者提供了與大廠競爭的工具,推動創(chuàng)意產(chǎn)業(yè)進入“人人皆可創(chuàng)作”的新階段。 谷歌透露,未來還將推出“AI導(dǎo)演”功能,通過強化學(xué)習(xí)自動生成完整影片敘事框架。
可以看到的趨勢是,AIGC(人工智能生成內(nèi)容)正從“創(chuàng)意輔助”轉(zhuǎn)向“工業(yè)化生產(chǎn)”。
六、AI時代的“Android生態(tài)”逐漸完整
在硬件領(lǐng)域,谷歌聯(lián)合XREAL發(fā)布的Project Aura AR眼鏡,是本次大會的一大亮點。
據(jù)了解,該眼鏡搭載高通XR芯片和Gemini助手,支持實時導(dǎo)航、多語言翻譯、語音拍照等功能。其基于Android XR平臺,可接入谷歌應(yīng)用生態(tài)。
值得注意的是,在這個過程中,谷歌可通過開放Android XR SDK,吸引開發(fā)者構(gòu)建應(yīng)用,與蘋果Vision Pro、Meta雷朋眼鏡形成“平臺+硬件+內(nèi)容”的全方位對抗。
此外,谷歌還宣布Gemini將全面融入安卓生態(tài),覆蓋手機、智能手表、汽車儀表盤及電視等終端。用戶可通過電源鍵快速喚醒手機端的Gemini,而車載系統(tǒng)Android Auto、智能手表Wear OS及Google TV均已深度集成Gemini模型,支持自然語言交互與多任務(wù)處理。
Gemini深度集成至安卓電源鍵、汽車儀表盤等核心交互入口,本質(zhì)上是將用戶流量從第三方應(yīng)用(如Spotify、Uber)向谷歌自有服務(wù)(如Google Maps、YouTube)導(dǎo)流。
在降低開發(fā)門的API與工具鏈(如Live API、Agent模式)下,開發(fā)者一旦接入谷歌生態(tài),其數(shù)據(jù)存儲、模型調(diào)用均依賴谷歌云服務(wù),將形成“開發(fā)-部署-運營”的全鏈條依賴。
通過這種“全家桶式”整合,其實是谷歌在為自己成為AI時代的“水電煤供應(yīng)商”鋪路。這張從硬件到軟件的生態(tài)大網(wǎng),編織的愈發(fā)完整。
七、訂閱制商業(yè)模式,奔向盈利
除了產(chǎn)品的技術(shù),在商業(yè)模式上的變化,也是谷歌在 AI 商業(yè)化道路上的一次重要嘗試。
具體來看,谷歌推出了每月 249.99 美元的 AI Ultra 訂閱計劃,為追求極致體驗的用戶提供最高權(quán)限的模型訪問(如Veo 3、Deep Think模式)、30TB云存儲及優(yōu)先體驗權(quán)。
這一動作背后,其實是谷歌通過這一模式,瞄準企業(yè)用戶和專業(yè)開發(fā)者,構(gòu)建“軟硬一體”的利潤池。
例如,開發(fā)者可通過訂閱服務(wù)訪問Gemini 2.5 Pro的深度推理能力,而企業(yè)用戶則能利用AI Ultra的生成工具提升內(nèi)容創(chuàng)作效率。
AI Ultra的推出標志著AI服務(wù)從“功能采購”轉(zhuǎn)向“能力訂閱”,推動行業(yè)向云計算模式靠攏。谷歌的訂閱制策略與OpenAI(200美元/月)和Anthropic(200美元/月)形成競爭,但其通過全家桶生態(tài)(搜索、Workspace、Android)形成差異化優(yōu)勢。
例如,AI Ultra用戶可享受YouTube Premium服務(wù)、Google Drive的30TB存儲空間,以及由Project Mariner技術(shù)支持的代理工具。
這一模式不僅提升了谷歌的盈利能力,也為AI技術(shù)的商業(yè)化落地提供了新路徑。
2025年Google I/O開發(fā)者大會揭示了AI技術(shù)從實驗室走向產(chǎn)業(yè)落地的三大核心趨勢:
一是從“通用”到“垂直”,Gemini 2.5 Pro的深度推理、Mariner的流程自動化等功能,證明AI技術(shù)正逐漸具備解決行業(yè)具體痛點的能力。;二是從“替代”到“增強”,AI不再簡單替代人力,而是通過AR眼鏡、實時搜索等工具擴展人類感知與決策能力;三是從“實驗”到“規(guī)?!?,訂閱制、開發(fā)者工具鏈和硬件生態(tài)的完善,標志著AI技術(shù)在規(guī)模化商用這條路上又邁進了一步。
正如谷歌CEO皮查伊所言:“我們正進入AI平臺變革的新階段。”這場發(fā)布會不僅是一次技術(shù)秀,更是一場關(guān)于未來十年產(chǎn)業(yè)變革的宣言——AI的戰(zhàn)場,正在從代碼與算力,轉(zhuǎn)向千行百業(yè)的真實場景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.