AI新浪潮觀察
7min read
谷歌發(fā)布 1800 元/月的 AI 訂閱,還把「通用 AI」塞進(jìn)了生態(tài)每個(gè)角落
張勇毅2025/05/23
摘要
軟件硬件雙管齊下,定義「下一代 AI 產(chǎn)品」怎么做。
首先是一個(gè)冷知識(shí):ChatGPT 中的「T」代表「Transformer」,這個(gè)概念是谷歌的一群工程師在 2017 年提出的,并發(fā)表在一篇現(xiàn)在已成經(jīng)典的論文《Attention Is All You Need》中。
這個(gè)小細(xì)節(jié),很大程度上能說(shuō)明谷歌在 AI 領(lǐng)域并不是一個(gè)花架子團(tuán)隊(duì),而是由一群 AI 產(chǎn)品業(yè)內(nèi)經(jīng)驗(yàn)最豐富的老兵組成的團(tuán)隊(duì),從 Gemini 2.5 發(fā)布之后,Google 在 AI 領(lǐng)域的優(yōu)勢(shì)已經(jīng)頗有點(diǎn)「漸入佳境」的感覺(jué):基礎(chǔ)模型能力的大幅提升,加上 Gemini 在谷歌軟件生態(tài)內(nèi)的逐漸深入,讓全球數(shù)以十億計(jì)的用戶都在這個(gè)過(guò)程中,逐漸被「轉(zhuǎn)化」成谷歌 AI 產(chǎn)品的用戶。
如何「轉(zhuǎn)化普通用戶變成 AI 產(chǎn)品用戶」,是這個(gè)時(shí)代幾乎所有 2C AI 產(chǎn)品都需要回答的問(wèn)題,顯而易見(jiàn),在這個(gè)問(wèn)題上,Google 已經(jīng)憑借著巨大的存量用戶優(yōu)勢(shì),甩開(kāi)了所有競(jìng)爭(zhēng)對(duì)手——但谷歌同樣需要奔跑不停,才能在 Perplexity、OpenAI 以及微軟等強(qiáng)大競(jìng)爭(zhēng)對(duì)手的圍剿中,留住用戶的心。
Google 顯然最清楚在端側(cè) AI 爆發(fā)的時(shí)代,谷歌的實(shí)際優(yōu)勢(shì)在哪里,用戶同樣知道谷歌知道他們想要哪些 AI 能力,出現(xiàn)在自己最常用的日常應(yīng)用中。
這就是今年谷歌 I/O 2025 大家的共識(shí),Google 也確實(shí)在主題演講中,幾乎全程都在介紹谷歌在這些領(lǐng)域中的潛力,以及向世界展示,AI 能給這些用戶原本已經(jīng)熟悉的使用體驗(yàn)帶來(lái)哪些改變。
01
Google 搜索引擎 AI Mode 深入
作為目前巨頭中 AI 落地成效最顯著的選手,Google 毫不掩飾自己在 AI 產(chǎn)品商業(yè)化用戶規(guī)模上的領(lǐng)先,上來(lái)就展示了大量 AI 能力在谷歌產(chǎn)品中的實(shí)際應(yīng)用成果。
Google CEO 桑達(dá)爾-皮查伊 介紹,基于 Gemini 能力的 AI 總結(jié)功能現(xiàn)在已覆蓋全球超過(guò) 15 億用戶,AI 總結(jié)功能在全球的調(diào)用次數(shù)增長(zhǎng)已經(jīng)超過(guò) 10%,而且這種增長(zhǎng)還在持續(xù)。多模態(tài)識(shí)別能力的谷歌Lens 現(xiàn)在同樣已經(jīng)有超過(guò) 15 億的月活用戶。
桑達(dá)爾-皮查伊將其稱(chēng)為「搜索引擎過(guò)去十年內(nèi)最成功的革命」| 圖片來(lái)源:極客公園
但 AI 顯然不只是能在搜索引擎上起到作用,比如谷歌同時(shí)就宣布了新的「虛擬試穿」功能,谷歌會(huì)要求你提供一張全身照片,通過(guò)大模型「理解人體和服裝的細(xì)微差別,不同材料在不同身體上折疊、拉伸和垂墜。然后使用這張照片,生成你穿著你正在選購(gòu)的衣服的圖像。
一直傳聞中的谷歌想要借助 Chrome 入局 AI 瀏覽器,本次 IO 中也終于嶄露頭角,除了 Chrome 瀏覽器本身更深度的整合 Gemini 接口、識(shí)別網(wǎng)頁(yè)內(nèi)容以外,谷歌還為搜索引擎調(diào)添加了全新的「AI 模式」。這個(gè)模式把類(lèi)似 Gemini 或 ChatGPT 的聊天機(jī)器人功能直接帶入了用戶的網(wǎng)頁(yè)搜索體驗(yàn)。你可以用它來(lái)找鏈接,但也能更快地獲取信息、追問(wèn)問(wèn)題,讓 Gemini 以平時(shí)在普通網(wǎng)頁(yè)上找不到的方式來(lái)整合信息。
谷歌搜索的負(fù)責(zé)人甚至放出豪言:如果你想知道互聯(lián)網(wǎng)上最重要的搜索引擎未來(lái)會(huì)變成什么樣,那你就去點(diǎn)開(kāi)「AI 模式」看看。
「AI 模式」同時(shí)也支持深度研究功能,會(huì)自動(dòng)將用戶的提示詞轉(zhuǎn)化為海量的搜索,并自動(dòng)查找和整合信息,同時(shí)在這個(gè)模式下,AI 搜索還可以訪問(wèn)你之前的搜索記錄,你也可以手動(dòng)開(kāi)啟權(quán)限,讓它可以訪問(wèn)你的電子郵件,以便 AI能更了解「你是誰(shuí)」以及你關(guān)心什么。
把所有這些功能加起來(lái),你就會(huì)得到一個(gè)更加靈活和個(gè)性化的 AI 搜索,無(wú)論是針對(duì)用戶本身還是當(dāng)前的具體查詢(xún),顯然都能根據(jù)用戶信息給出更加精準(zhǔn)的回答。
Gemini 2.5 家族也同時(shí)加入了支持深度思考的版本 —— Gemini 2.5 Pro Deep Think,在2025 年美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽 (USAMO)中取得了40.4% 的高分,要知道這可是最難的數(shù)學(xué)基準(zhǔn)測(cè)試之一,比之前的 2.5 Pro 版本足足提升了 10 多個(gè)百分點(diǎn)。同時(shí)在LiveCodeBench 競(jìng)賽級(jí)編程難題中,它的得分更是高達(dá)80.4%。同時(shí),在多模態(tài)推理 MMMU測(cè)試中,也取得了84.0%的成績(jī)。
Gemini Live 的攝像頭共享功能于去年在谷歌I/O 大會(huì)上首次亮相,當(dāng)時(shí)它的名字還叫Project Astra,隨后作為 Gemini Live 在 Android 上正式推出。它允許谷歌Gemini「看到」您攝像頭中的一切,因此您可以就周?chē)氖澜邕M(jìn)行持續(xù)對(duì)話——例如,根據(jù)冰箱中的食材詢(xún)問(wèn)食譜建議。
隨著谷歌在用戶場(chǎng)景中逐漸深入,現(xiàn)在這一功能被直接引入搜索的AI模式中,通過(guò)點(diǎn)擊「Live」圖標(biāo),用戶將能夠與搜索共享他們的攝像頭畫(huà)面,并直接詢(xún)問(wèn)眼前的事物,例如自行車(chē)應(yīng)該如何組裝。并且可以自動(dòng)根據(jù)上下文對(duì)你們的情況進(jìn)行同步更新回答。
在現(xiàn)場(chǎng)的演示中,最令筆者印象深刻的新功能,是其新獲得的主動(dòng)性??梢愿鶕?jù)它觀察到的事件選擇何時(shí)開(kāi)口,像一個(gè)真人一樣,對(duì)你的操作進(jìn)行建議,例如在用戶做作業(yè)時(shí)進(jìn)行觀察,它可能會(huì)注意到您犯了一個(gè)錯(cuò)誤,并直接指出用戶哪里錯(cuò)了,而不是反過(guò)來(lái)等著用戶要求 AI 去執(zhí)行任務(wù)。
據(jù) DeepMind CEO Demis Hassabis 表示,教 AI 自主行動(dòng)一直是計(jì)劃的一部分。這些「察言觀色」的技巧,是人類(lèi)相對(duì)擅長(zhǎng)但難以量化或研究的事情。
02
Android XR
明眼人看到這里已經(jīng)能反映過(guò)來(lái)了:比起手機(jī)攝像頭,這個(gè)如此深入現(xiàn)實(shí)世界的多模態(tài) AI 功能,似乎更適合的載體是在眼鏡上。
Google 顯然同樣想到了這一點(diǎn),隨即趁熱打鐵,宣布了 Android XR 的新進(jìn)展,同時(shí)在現(xiàn)場(chǎng)展示了谷歌XR 眼鏡的原型機(jī)。
在演示中,Google 強(qiáng)調(diào)它們是使用 Gemini 的「最佳硬件」:Google的、 展示的原型眼鏡搭載有相機(jī),麥克風(fēng)和揚(yáng)聲器,Gemini 可以調(diào)用這些硬件,幫用戶理解周?chē)氖澜纭M瑫r(shí)在顯示屏上顯示類(lèi)似地圖導(dǎo)航等更多信息。
目前,谷歌正通過(guò)與三星、XREAL 的合作,來(lái)研發(fā)首批搭載 Android XR 操作系統(tǒng)的眼鏡硬件。谷歌 XR 副總裁 Shahram Izadi 表示,第一款硬件設(shè)備是三星的 Project Moohan,但那是一款更接近 Apple Vision Pro 的 XR 頭顯。第二款 Project Aura 屬于 XREAL。定位是一款 AR 眼鏡。
除了三星、XREAL 這樣的硬件廠商,Google 顯然也是從 Meta Ray-Ban 的大獲成功中吸取到了經(jīng)驗(yàn),同時(shí)也宣布了與包括 Gentle Monster 在內(nèi)的兩家時(shí)尚眼鏡巨頭合作,一同將 AI 眼鏡打造的更加時(shí)尚。
03
AI 創(chuàng)作全家桶
除了直接面向最多普通用戶的 Gemini,Google 同時(shí)還針對(duì)創(chuàng)作者的一系列 AI 創(chuàng)作工具,進(jìn)行了更新?lián)Q代 —— 其中不僅有直接與 Sora 競(jìng)爭(zhēng)的 Veo3、圖像生成工具 image4,Lyria 2 音樂(lè)生成模型,還有全新視頻創(chuàng)作工具 FLOW。
Veo 3 相比前代,最大的升級(jí)是它可以生成包含音效、背景噪音,甚至對(duì)話的視頻。
谷歌現(xiàn)場(chǎng)演示了一段 CGI 級(jí)別的生成動(dòng)畫(huà),其中動(dòng)物在森林里說(shuō)話。聲音和視頻完美同步:有聲音的視頻顯然大大提升了 AI 生成視頻的實(shí)用性。谷歌 DeepMind 首席執(zhí)行官 Demis Hassabis 也表示:「我們正在走出視頻生成的‘無(wú)聲時(shí)代’?!?/p>
Google 同步宣布了「大杯」和「超大杯」訂閱服務(wù),AI Pro 與 AI Ultra,其中頂配的谷歌AI Ultra 要價(jià)每月 249 美元,但同時(shí)也確實(shí)提供了物超所值的服務(wù) —— 例如幾乎無(wú)限制的各項(xiàng)服務(wù)使用額度,以及 30TB 的谷歌Cloud 云端存儲(chǔ)容量。
AI Ultra 計(jì)劃允許用戶試用 Gemini 2.5 Pro 全新的增強(qiáng)推理模式 Deep Think,據(jù)谷歌介紹,該模式專(zhuān)為「高度復(fù)雜」的數(shù)學(xué)和編程問(wèn)題設(shè)計(jì)。它還提供 Chrome 中 Gemini 的早期訪問(wèn)權(quán)限,允許訂閱者直接在瀏覽器中使用 AI 完成任務(wù)和總結(jié)信息。
除了這些之外,訂閱用戶還可以試用谷歌的 AI Agent 原型 —— Project Mariner,可以同時(shí)自動(dòng)化多達(dá) 10 項(xiàng)任務(wù),例如查找信息、預(yù)訂和購(gòu)買(mǎi)產(chǎn)品。
通過(guò)將 Gemini 能力深度融入搜索引擎、Chrome瀏覽器、虛擬試穿、乃至全新的Android XR生態(tài)和AI眼鏡,Google不僅在提升現(xiàn)有產(chǎn)品的用戶體驗(yàn),同時(shí)也是在潛移默化地定義「下一代 AI 產(chǎn)品」怎么做。
顯然,在端側(cè) AI 產(chǎn)品如何做這件事上,Google I/O 展示出的「軟件硬件雙管齊下」,已經(jīng)足以讓谷歌再次成為 AI 產(chǎn)品生態(tài)中最讓人忌憚的選手。
GoogleI/OGeminiAndroidXR
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.