作者|周雅
太平洋時(shí)間5月20日上午,在加州山景城海岸線圓形劇場(chǎng)(Shoreline Amphitheatre),空氣中彌漫著咖啡香氣和一種幾乎能觸摸到電子脈沖般的興奮感,2025 Google I/O(谷歌開發(fā)者大會(huì))開始了,而此時(shí)的我們,正處于這股AI浪潮的中心。
當(dāng)現(xiàn)場(chǎng)倒計(jì)時(shí)結(jié)束,谷歌及Alphabet首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)走上舞臺(tái),他以一個(gè)玩笑開場(chǎng):
“聽說(shuō)今天是雙子座月份(Gemini Season)的開始,這沒(méi)什么特別的,因?yàn)樵诠雀瑁刻於际请p子座月份(Gemini season)。”這句略帶凡爾賽的調(diào)侃,暗示了谷歌在AI領(lǐng)域的持續(xù)迭代。
他直言,“以往I/O前夕通常會(huì)‘憋大招’,因?yàn)橄氚炎钪匕醯陌l(fā)布留到大會(huì)上;但在Gemini時(shí)代,谷歌更希望把最先進(jìn)的模型更快推向用戶、更快融入產(chǎn)品中,所以發(fā)布速度比任何時(shí)候都更快。”為了印證這一點(diǎn),他還列舉了一系列數(shù)字:自去年I/O以來(lái),谷歌已發(fā)布了超過(guò)12個(gè)模型和研究突破+20多項(xiàng)AI產(chǎn)品和功能。
谷歌及Alphabet首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)
所以今年的I/O,依然是應(yīng)接不暇的產(chǎn)品發(fā)布節(jié)奏,給我最直觀感受就是:谷歌要把Gemini變成世界模型,變成一個(gè)既能看能聽能說(shuō),又能理解、跨設(shè)備為你執(zhí)行各種任務(wù)的通用AI助手。用大白話說(shuō),就是感受到Gemini有種“活人感”,谷歌用行動(dòng)詮釋了什么叫做“研究即產(chǎn)品、產(chǎn)品即平臺(tái)、平臺(tái)即生態(tài)”。
當(dāng)然,如果要梳理這場(chǎng)I/O的重點(diǎn),此處有省流版:
· Gemini應(yīng)用承載谷歌構(gòu)建“通用AI助手”的雄心。 通過(guò)融合Project Astra的視覺與情境感知能力,Gemini Live變得更加耳聰目明;Deep Research和Canvas賦予用戶強(qiáng)大的信息處理、知識(shí)再創(chuàng)能力;Gemini in Chrome則將智能帶入桌面瀏覽;而集成了Imagen 4和Veo 3的Gemini應(yīng)用,更是讓圖像與視頻創(chuàng)作觸手可及;Agent Mode則預(yù)示著AI助手未來(lái)將能為我們處理多步驟任務(wù)。
· Gemini模型家族一切的“大腦”。無(wú)論是2.5 Pro的性能制霸、Flash的效率優(yōu)化,還是DeepThink對(duì)推理極限的、Diffusion對(duì)文本生成范式的探索,都為上層應(yīng)用的爆發(fā)提供動(dòng)力。
· Gemini重塑谷歌搜素:谷歌搜索新增“AI模式”(AI Mode),提供高級(jí)推理、多模態(tài)交互、深度探索能力,它憑借查詢、個(gè)性化上下文、深度研究、實(shí)時(shí)多模態(tài)交互、智能體輔助購(gòu)物和任務(wù)處理等“組合拳”,在徹底重塑我們獲取信息、解決問(wèn)題、乃至完成現(xiàn)實(shí)世界任務(wù)的方式。
· 生成式AI領(lǐng)域的技術(shù)與藝術(shù)共創(chuàng)。 Lyria 2和Music AI Sandbox為音樂(lè)人而生;SynthID及其檢測(cè)工具則為AI生成內(nèi)容的可信度保駕護(hù)航;Veo與頂尖導(dǎo)演的合作,以及專為電影人打造的Flow工具,則預(yù)示著AI將在專業(yè)影視創(chuàng)作中越來(lái)越重要。
· 開發(fā)者生態(tài)的構(gòu)建也是重中之重。 異步編碼智能體Jules的公測(cè),Project Mariner計(jì)算機(jī)使用能力的開放,以及對(duì)開放智能體協(xié)議(如MCP)的支持,都在為開發(fā)者提供更強(qiáng)大的工具,降低構(gòu)建復(fù)雜AI應(yīng)用的門檻。
· 對(duì)人機(jī)交互的顛覆性探索。谷歌發(fā)布Android XR,有了Gemini加持的智能眼鏡、耳機(jī),可以在虛擬世界和物理世界之間架橋。
相當(dāng)哇塞的Android XR
首當(dāng)其沖,我們不得不提這次IO的壓軸,也是把現(xiàn)場(chǎng)氣氛推向高潮的發(fā)布——「Android XR」。
說(shuō)到XR,就得說(shuō)智能眼鏡。而說(shuō)到智能眼鏡,就不得不提Google Glass。
曾經(jīng)在2012年,谷歌在Google I/O大會(huì)上播放了這樣一段畫面:幾名翼裝飛行運(yùn)動(dòng)員準(zhǔn)備跳傘,當(dāng)機(jī)艙門打開,運(yùn)動(dòng)員依次躍入舊金山4000英尺的高空,降落在一座建筑附近,畫面視角顯示他們騎上自行車、穿過(guò)一個(gè)走廊、推開一扇門,最終來(lái)到了I/O的會(huì)議室現(xiàn)場(chǎng)——而這,一整段在當(dāng)時(shí)看起來(lái)甚至有點(diǎn)抖動(dòng)的畫面,都是由運(yùn)動(dòng)員佩戴的Google Glass拍攝直播。這是谷歌智能眼鏡的雛形,但卻一直不溫不火。
所謂念念不忘必有回想,這一次,谷歌希望把失去的奪回來(lái)。
谷歌XR業(yè)務(wù)的副總裁兼總經(jīng)理Shahram Izadi現(xiàn)場(chǎng)指出:“Android是體驗(yàn)AI的最佳場(chǎng)所,今天你看到的許多Gemini突破性進(jìn)展很快都將登陸Android……我們將把Gemini帶到你的手表、汽車、甚至電視上,所以無(wú)論你身在何處,都有一個(gè)有用的AI助手讓生活更便利。”
緊接著,Shahram提出一個(gè)引人深思的問(wèn)題:“如果要以全新方式體驗(yàn)AI助手,應(yīng)該用什么新型設(shè)備呢?”隨后,他正式官宣Android XR——“Android XR是Gemini時(shí)代構(gòu)建的首個(gè)Android平臺(tái),支持從頭顯、耳機(jī)、智能眼鏡等各種設(shè)備。”
Shahram闡述了谷歌對(duì)XR設(shè)備形態(tài)的看法:“我們相信XR沒(méi)有一刀切的方案,你會(huì)在一天中用不同的設(shè)備。例如,看電影、玩游戲或工作時(shí),你會(huì)想要沉浸式頭顯。但在旅途中,你會(huì)想要輕便的眼鏡,它可以在不掏出手機(jī)的情況下為你提供及時(shí)的信息。”
為了讓大家直觀感受,谷歌員工Nishtha Bhatia在現(xiàn)場(chǎng)來(lái)了一場(chǎng)Android XR智能眼鏡的實(shí)時(shí)演示,從后臺(tái)走到臺(tái)前,與智能眼鏡互動(dòng)的完整視角。
從視頻中可看出,它具備這些能力(看不到視頻的請(qǐng)移步「科技行者公眾號(hào):itechwalker」):
· 實(shí)時(shí)通訊與通知管理:Nishtha收到了Shahram發(fā)來(lái)的短信,并通過(guò)語(yǔ)音指令讓Gemini回復(fù)并靜音通知。
· 情境感知與信息檢索:Nishtha對(duì)后臺(tái)照片墻上的一支樂(lè)隊(duì)感到好奇,問(wèn)它樂(lè)隊(duì)的名字,Gemini準(zhǔn)確識(shí)別出那是灣區(qū)傳奇搖滾樂(lè)隊(duì)Counting Crows,并介紹了他們與Shoreline圓形劇場(chǎng)的淵源,甚至直接展示了樂(lè)隊(duì)演出的舊照,還播放了樂(lè)隊(duì)的歌曲。
· 記憶與信息提取:Nishtha讓Gemini回憶,她之前在后臺(tái)喝的咖啡杯上咖啡店的名稱,Gemini準(zhǔn)確回答出可能是“Bloomsgiving”,并描述了這家位于Castro街的咖啡店。
· 視覺搜索與導(dǎo)航:Gemini展示了該咖啡店的照片,并計(jì)算出步行前往所需的時(shí)間(約1小時(shí)),眼鏡上可以顯示導(dǎo)航方向和3D地圖。
· 日程管理:Nishtha讓Gemini向同事發(fā)送了下午3點(diǎn)在這家咖啡店喝咖啡的邀請(qǐng)。
· 拍照功能:在Shahram的提議下,Nishtha讓Gemini為他們和現(xiàn)場(chǎng)觀眾合影,并將照片加到收藏夾。
· 實(shí)時(shí)語(yǔ)言翻譯:作為最后即興演示,Shahram(說(shuō)波斯語(yǔ))和Nishtha(說(shuō)印地語(yǔ))用各自的母語(yǔ)進(jìn)行了對(duì)話。他們眼鏡的畫面實(shí)時(shí)顯示在主屏幕上,并配有英語(yǔ)翻譯字幕。
所以可以說(shuō),Android XR并不是雛形,而是能扛住實(shí)時(shí)演示壓力的成熟產(chǎn)品:
1. Gemini on Headsets (頭顯上的Gemini):Shahram介紹了三星的Project Moohan,這是首款A(yù)ndroidXR設(shè)備。例如,在XR版的Google Maps中,用戶只需讓Gemini帶路,就能“傳送”到世界任何地方;用戶可以與AI助手討論看到的任何事物,并讓它調(diào)出相關(guān)的視頻和網(wǎng)站;他還描繪了在MLB應(yīng)用中看比賽的場(chǎng)景,就像是置身體育場(chǎng)前排,同時(shí)與Gemini討論球員和比賽數(shù)據(jù)。三星的Project Moohan將于今年晚些時(shí)候上市銷售。
2. Android XR Glasses (安卓XR眼鏡):隨后,Shahram將焦點(diǎn)轉(zhuǎn)向了更具便攜性的眼鏡形態(tài)。“如你所知,我們研究眼鏡已有十多年,從未停止。”他描述了Android XR眼鏡的特性:輕便,專為全天佩戴而設(shè)計(jì),眼鏡與手機(jī)協(xié)同工作,讓用戶在解放雙手的同時(shí)訪問(wèn)應(yīng)用程序。他強(qiáng)調(diào):“所有這些都使眼鏡成為AI的自然形態(tài),將Gemini的能力帶到你所在的地方,所以,不像克拉克·肯特(超人),你戴上眼鏡就能獲得超能力。”
接下來(lái),Shahram宣布了Android XR的合作歷程:
· 首先,谷歌與三星共同構(gòu)建了AndroidXR,并與高通合作為搭載驍龍的產(chǎn)品進(jìn)行了優(yōu)化。
· 其次,Android XR開發(fā)者預(yù)覽版自去年發(fā)布以來(lái),已有數(shù)百名開發(fā)者為該平臺(tái)進(jìn)行構(gòu)建。
· 最后,谷歌也在為XR重新設(shè)計(jì)其核心應(yīng)用,并且由于是Android平臺(tái),現(xiàn)有的手機(jī)和平板電腦應(yīng)用也能在XR設(shè)備上運(yùn)行。
圖:谷歌現(xiàn)場(chǎng)官宣Gentle Monster和Warby Parker將成為首批采用Android XR的眼鏡品牌。
集大成者的Gemini:又雙叒叕升級(jí)了
壓軸產(chǎn)品講完后,當(dāng)然得講重要產(chǎn)品,也就是谷歌AI戰(zhàn)略的基石——Gemini,這次主要講的是Gemini 2.5 Pro與Flash的升級(jí),各方面更強(qiáng)了。
怎么證明Gemini更強(qiáng)了呢,用數(shù)據(jù)說(shuō)話!桑達(dá)爾·皮查伊特別提到了Gemini 2.5 Pro進(jìn)展的迅速:Elo分?jǐn)?shù)(衡量模型能力的一種指標(biāo))自第一代Gemini Pro以來(lái)提升了300多分;Gemini 2.5 Pro在LMArena排行榜所有類別中均名列前茅,并在多個(gè)基準(zhǔn)測(cè)試中達(dá)到業(yè)界頂尖水平;在編碼能力上,更新后的Gemini 2.5 Pro登頂WebDev Arena(一個(gè)專注于評(píng)估模型Web開發(fā)能力的排行榜)。這些成就的背后,是開發(fā)者社區(qū)的廣泛認(rèn)可,例如在AI代碼編輯器Cursor上,Gemini是年度增長(zhǎng)最快的模型,每分鐘產(chǎn)生數(shù)十萬(wàn)行代碼。
此外,輕量級(jí)的Gemini 2.5 Flash也迎來(lái)了顯著升級(jí),它在推理、多模態(tài)、代碼和長(zhǎng)上下文等關(guān)鍵基準(zhǔn)測(cè)試中表現(xiàn)更佳,同時(shí)效率也進(jìn)一步優(yōu)化,評(píng)估顯示其token消耗減少了20-30%。對(duì)于追求極致效率和低成本應(yīng)用的開發(fā)者而言,這無(wú)疑是個(gè)福音。
皮查伊還分享了一個(gè)有趣的成績(jī):幾周前,Gemini成功通關(guān)了經(jīng)典游戲了《精靈寶可夢(mèng):藍(lán)》(Pokémon Blue),獲得了八枚徽章,擊敗了四天王和冠軍,他風(fēng)趣地稱之為“離實(shí)現(xiàn)API又近了一步,因?yàn)锳PI是——Artificial Pokémon Intelligence(人工·寶可夢(mèng)·智能)”。這個(gè)巧妙的諧音梗再次引發(fā)現(xiàn)場(chǎng)一片笑聲。
而關(guān)于Gemini 2.5 Pro的一個(gè)更新亮點(diǎn),是上線了增強(qiáng)推理模式——「Deep Think(深度思考」,DeepThink采用了谷歌在思考和推理方面的前沿研究,包括并行技術(shù),其表現(xiàn)可圈可點(diǎn):在數(shù)學(xué)基準(zhǔn)測(cè)試2025 USAMO上取得了好成績(jī),在編程競(jìng)賽基準(zhǔn)LiveCodeBench上領(lǐng)先,在測(cè)試多模態(tài)推理的MMMU上也獲得了84.0%的高分。不過(guò),盡管DeepThink潛力巨大,谷歌也保持了足夠的審慎,強(qiáng)調(diào)由于Deep Think定義了前沿能力,需要更多時(shí)間進(jìn)行安全評(píng)估并聽取安全專家的意見,目前會(huì)先通過(guò)Gemini API提供給受信任的測(cè)試者,以收集反饋,然后再考慮廣泛推廣。
構(gòu)建通用AI助手:從Project Astra的實(shí)時(shí)感知,到Project Mariner的多任務(wù)智能體
當(dāng)Google DeepMind首席執(zhí)行官Demis Hassabis登臺(tái),他的演講總是飽含對(duì)AGI(通用人工智能)的思考。
圖:Google DeepMind首席執(zhí)行官Demis Hassabis
這次,他描繪了一個(gè)AGI藍(lán)圖:將Gemini打造成世界模型(world model),是開發(fā)通用AI助手的關(guān)鍵,即一種“個(gè)性化(Personal)、主動(dòng)(Proactive)、強(qiáng)大(Powerful)的AI”,這種AI能理解物理和數(shù)字環(huán)境,并能跨設(shè)備代表用戶規(guī)劃和采取行動(dòng)。這是Gemini的終極目標(biāo),也是谷歌邁向AGI的重要一步。
為了讓這個(gè)愿景更加具象,Hassabis重點(diǎn)介紹了Project Astra的進(jìn)展。去年作為研究原型首次亮相的Astra,其視頻理解、屏幕共享、記憶等能力令人印象深刻。在過(guò)去一年里,這些能力被逐步整合到Gemini Live中。
Hassabis透露,團(tuán)隊(duì)持續(xù)改進(jìn)并探索前沿創(chuàng)新,例如,將語(yǔ)音輸出升級(jí)為更自然的原生音頻,改進(jìn)了記憶功能,并增加了計(jì)算機(jī)控制能力。目前,這些新功能正在通過(guò)受信任的測(cè)試者收集反饋,并計(jì)劃將其引入Gemini Live、搜索中的新體驗(yàn)、面向開發(fā)者的Live API、眼鏡等新形態(tài)設(shè)備。他特別強(qiáng)調(diào):“在這一過(guò)程的每一步,安全和責(zé)任都是我們工作的核心。”
現(xiàn)場(chǎng)播放的一段Project Astra演示視頻(看不到視頻的請(qǐng)移步「科技行者公眾號(hào):itechwalker」),展示了AI在輔助用戶修理自行車等復(fù)雜任務(wù)中的實(shí)力。Astra能夠幫助用戶查找手冊(cè)、定位剎車部件、搜索YouTube修復(fù)視頻、查閱郵件獲取零件信息、高亮顯示零件盒、呼叫自行車店詢問(wèn)庫(kù)存,甚至在對(duì)話被打斷后仍能記住上下文并繼續(xù)提供幫助。這段演示充分展現(xiàn)了一個(gè)理想中的通用AI助手所應(yīng)具備的多任務(wù)處理、信息檢索、工具調(diào)用、情境記憶和主動(dòng)建議等能力。
隨后,話題焦點(diǎn)轉(zhuǎn)移到了Project Mariner,一個(gè)探索人與智能體交互未來(lái)的研究原型,始于瀏覽器環(huán)境。自去年12月啟動(dòng)以來(lái),Mariner與一組受信任的測(cè)試者緊密合作,收集反饋并改進(jìn)其實(shí)驗(yàn)性功能。Hassabis宣布:“Project Mariner現(xiàn)在包含一個(gè)智能體系統(tǒng),可以同時(shí)完成多達(dá)十個(gè)不同的任務(wù)。這些智能體可以幫助你查找信息、預(yù)訂、購(gòu)物、做研究等等——所有這些都可以同時(shí)進(jìn)行。”更新后的Project Mariner已向美國(guó)的Google AI Ultra訂閱用戶開放,其計(jì)算機(jī)使用能力也將被引入Gemini API,并計(jì)劃在年內(nèi)將更多功能引入谷歌產(chǎn)品。
Hassabis總結(jié)道:“通過(guò)這項(xiàng)以及我們所有開創(chuàng)性的工作,我們正在構(gòu)建更個(gè)性化、更主動(dòng)、更強(qiáng)大的AI,豐富我們的生活,加速科學(xué)進(jìn)步的步伐,并迎來(lái)一個(gè)充滿發(fā)現(xiàn)和奇跡的新黃金時(shí)代。”
創(chuàng)意伊甸園:Veo 3攜音入畫,Imagen 4精雕細(xì)琢,F(xiàn)low剪AI電影
當(dāng)Google DeepMind的產(chǎn)品管理副總裁Eli Collins走上舞臺(tái),整個(gè)會(huì)場(chǎng)的氛圍變得更加輕松和富有藝術(shù)感,他揭示了谷歌在生成式模型領(lǐng)域的最新突破——Veo 3、Imagen 4、以及一款名為Flow的全新AI電影制作工具。
1、視頻生成模型Veo 3。它首次實(shí)現(xiàn)了視頻與音頻的同步生成,這代表AI生成的視頻場(chǎng)景將擁有更強(qiáng)的沉浸感——城市街道場(chǎng)景中的交通噪音、公園里鳥兒的歌唱,甚至角色間的對(duì)話,都能被自然融入。Collins強(qiáng)調(diào):“Veo 3在文本和圖像提示理解、真實(shí)世界物理模擬以及準(zhǔn)確的口型同步方面表現(xiàn)出色。你可以用簡(jiǎn)短的故事作為提示,模型就能生成生動(dòng)的視頻片段。”Veo 3即日起在美國(guó)通過(guò)Gemini應(yīng)用向Ultra訂閱用戶開放,并在Flow工具中可用,企業(yè)用戶則可通過(guò)Vertex AI使用。
2、AI電影制作工具——Flow。它被Eli形容成一個(gè)“與創(chuàng)作者共同打造,并為創(chuàng)作者服務(wù)”的工具,它將Google DeepMind最先進(jìn)的模型——Veo、Imagen和Gemini整合在一起,讓用戶能夠無(wú)縫創(chuàng)作電影片段、場(chǎng)景和故事。
比如,你可以用自然語(yǔ)言向Flow描述鏡頭,在一個(gè)便捷的界面管理故事元素(演員、地點(diǎn)、物體、風(fēng)格),并利用Flow將敘事編織成精美的場(chǎng)景。Flow即日起向美國(guó)的Google AI Pro和Ultra計(jì)劃訂閱用戶開放,未來(lái)將登陸更多國(guó)家。
3、圖像生成模型Imagen 4。它在復(fù)雜織物、水滴、動(dòng)物毛發(fā)等細(xì)節(jié)上的清晰度更佳,能夠生成多種寬高比、最高2K分辨率的圖像,更適合打印或演示。此外,它在拼寫和排版方面的能力顯著增強(qiáng),使得創(chuàng)作賀卡、海報(bào)甚至漫畫變得更加容易。Imagen 4已在Gemini應(yīng)用、Whisk、Vertex AI以及Workspace中的Slides、Vids、Docs等多個(gè)產(chǎn)品中可用。Collins還預(yù)告,不久將推出Imagen 4的快速版本,速度比Imagen 3快高達(dá)10倍。
4、音樂(lè)生成模型Lyria 2。今年4月,由Lyria 2驅(qū)動(dòng)的Music AI Sandbox擴(kuò)大了訪問(wèn)范圍,為音樂(lè)家、制作人和詞曲作者提供了一套實(shí)驗(yàn)性工具,激發(fā)新的創(chuàng)作可能性。Collins表示:“Lyria 2帶來(lái)了強(qiáng)大的作曲能力和無(wú)盡的探索空間,現(xiàn)已通過(guò)YouTube Shorts向創(chuàng)作者開放,并通過(guò)Vertex AI向企業(yè)開放。”此外,驅(qū)動(dòng)MusicFX DJ的交互式音樂(lè)生成模型Lyria RealTime也已通過(guò)API和AI Studio提供,讓任何人都能實(shí)時(shí)交互式地創(chuàng)作、控制和表演生成式音樂(lè)。
AI重塑搜索:從信息獲取,到智能洞察
谷歌搜索業(yè)務(wù)負(fù)責(zé)人Liz Reid的登場(chǎng),總是伴隨著對(duì)信息獲取方式的深刻洞察。
她首先回顧了去年I/O推出的AI Overviews(AI概覽)所帶來(lái)的深遠(yuǎn)影響,人們開始向谷歌提出更多、更復(fù)雜、更長(zhǎng)、甚至多模態(tài)的問(wèn)題。AI Overviews使得用戶更容易提出任何問(wèn)題并獲得有用的回應(yīng),同時(shí)附帶網(wǎng)頁(yè)鏈接。
Reid指出:“AI Overviews是過(guò)去十年中搜索領(lǐng)域最成功的發(fā)布之一。” 在美國(guó)和印度等主要市場(chǎng),AI Overviews使相關(guān)查詢類型的使用量增加10%以上,且提供了業(yè)界最快的AI響應(yīng)速度。
Reid強(qiáng)調(diào),谷歌正持續(xù)通過(guò)AI推進(jìn)搜索,從信息獲取邁向智能洞察。今天,她為我們展示了搜索未來(lái)的最新進(jìn)展。
核心發(fā)布是在Google Search中新增「AI Mode」模式。Reid將其描述為“我們最強(qiáng)大的AI搜索,具有更高級(jí)的推理和多模態(tài)能力,并能通過(guò)后續(xù)問(wèn)題和網(wǎng)頁(yè)鏈接進(jìn)行更深入的探索。”
未來(lái)幾個(gè)月內(nèi),谷歌將在Labs中向「AI模式」用戶推出幾項(xiàng)高級(jí)功能:AI模式中的Deep Search(深度搜索)、搜索中的實(shí)時(shí)能力(Search Live)、AI模式中的個(gè)性化上下文、自定義圖表、AI購(gòu)物伙伴等。
消費(fèi)者購(gòu)物產(chǎn)品副總裁Lilian Rincon介紹了AI模式下的購(gòu)物體驗(yàn)。在AI模式下,當(dāng)用戶表達(dá)購(gòu)物意圖時(shí),例如尋找一個(gè)“可愛的旅行包”,AI會(huì)理解并展示圖片。如果用戶進(jìn)一步縮小范圍,比如“適合五月份去俄勒岡州波特蘭旅行的包”,AI模式會(huì)啟動(dòng)“查詢扇出”,同時(shí)運(yùn)行多個(gè)搜索來(lái)確定適合雨天和長(zhǎng)途旅行的包應(yīng)具備哪些特性,然后推薦防水且易于取放物品的選項(xiàng)。屏幕右側(cè)的面板會(huì)隨著用戶的提問(wèn)動(dòng)態(tài)更新相關(guān)的產(chǎn)品和圖片,幫助用戶精確找到目標(biāo)或發(fā)現(xiàn)新品牌。
當(dāng)用戶決定購(gòu)買后,智能體結(jié)賬功能將大顯身手。用戶只需在任何產(chǎn)品列表上點(diǎn)擊“跟蹤價(jià)格”,設(shè)置好尺寸、顏色等偏好、以及期望花費(fèi)的金額。一旦價(jià)格下降到設(shè)定范圍,用戶會(huì)收到通知。如果準(zhǔn)備購(gòu)買,只需確認(rèn)購(gòu)買細(xì)節(jié)并點(diǎn)擊“為我購(gòu)買”。在后臺(tái),AI會(huì)將商品添加到商家網(wǎng)站的購(gòu)物車中,并通過(guò)Google Pay安全地代表用戶完成結(jié)賬。
而最讓現(xiàn)場(chǎng)觀眾感到新奇的,莫過(guò)于虛擬試衣功能。用戶只需上傳一張自己的照片,就能虛擬試穿Shopping Graph中數(shù)十億件服裝,帶來(lái)一種真正“量身定制”的試穿體驗(yàn)。
AI向善:谷歌踐行社會(huì)責(zé)任
在活動(dòng)接近尾聲時(shí),桑達(dá)爾·皮查伊再次回到舞臺(tái),他不僅回顧了當(dāng)天的發(fā)布,更將視野投向了AI技術(shù)在解決現(xiàn)實(shí)世界問(wèn)題、賦能公益事業(yè)、以及履行社會(huì)責(zé)任方面的意義。
皮查伊首先強(qiáng)調(diào),AI帶來(lái)的機(jī)遇是巨大的,而確保其益處惠及盡可能多的人,是開發(fā)者、技術(shù)構(gòu)建者和問(wèn)題解決者的共同責(zé)任。隨后,他分享了幾個(gè)令他深受啟發(fā)的AI應(yīng)用實(shí)例:
谷歌與合作伙伴建立了一個(gè)Firesat項(xiàng)目,針對(duì)日益嚴(yán)峻的全球野火問(wèn)題,利用多光譜衛(wèi)星圖像和AI技術(shù),實(shí)時(shí)監(jiān)測(cè)野火威脅;在颶風(fēng)海倫(Hurricane Helene)期間,谷歌旗下無(wú)人機(jī)公司W(wǎng)ing與沃爾瑪和紅十字會(huì)合作,利用無(wú)人機(jī)進(jìn)行救援物資的運(yùn)送。
在演講的最后,皮查伊分享了一個(gè)個(gè)人經(jīng)歷,強(qiáng)調(diào)了他對(duì)技術(shù)改善生活的深刻感悟:
“改善生活的機(jī)會(huì),我從不認(rèn)為理所當(dāng)然,最近的一次經(jīng)歷讓我深有體會(huì)。我和我的父母在舊金山,他們想做的第一件事就是乘坐Waymo(谷歌旗下的自動(dòng)駕駛汽車公司),就像許多其他游客一樣。”他回憶道,“我以前也坐過(guò)Waymo,但看著我80多歲的父親坐在前排,完全被震撼的樣子,我以全新的視角看待了這項(xiàng)進(jìn)步。這提醒我們,技術(shù)擁有激勵(lì)我們、推動(dòng)我們前進(jìn)的不可思議的力量。我迫不及待地想看到我們接下來(lái)將共同創(chuàng)造出哪些令人驚嘆的事物。”
按照往年慣例,皮查伊再次玩了一個(gè)老梗:數(shù)現(xiàn)場(chǎng)說(shuō)了多少遍AI。
他說(shuō):“今天,你們聽到了很多關(guān)于分?jǐn)?shù)。但我知道,有一個(gè)指標(biāo)是你們都在等待的——我們的AI計(jì)數(shù)器!”
隨著他的話,大屏幕上出現(xiàn)了一個(gè)“AI提及次數(shù)排行榜”,Gemini以95次高居榜首。
皮查伊風(fēng)趣地說(shuō):“看起來(lái)我們有了一個(gè)新晉者,Gemini以95次領(lǐng)先,非常令人振奮。”
現(xiàn)場(chǎng)再次響起一片掌聲。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.