5月21日凌晨,科技巨頭谷歌召開了I/O 2025開發者大會,除了萬眾矚目的AI功能,谷歌還公布了安卓XR平臺和安卓16的新規劃及部分新特性。
谷歌CEOSundar Pichai表示,去年同期谷歌AI大模型和API每月處理9.7萬億個Token,現在這一數字增長到了480萬億個,谷歌搜索業務的AI綜述功能月活用戶也達到了15億人。
AI正逐漸融入我們的生活,成為不可或缺的一部分。無論是谷歌推出的全新大模型和AI應用,還是XR平臺和手機系統,都無法脫離AI的影響。
AI:從大模型變成一站式服務平臺
作為谷歌I/O大會的絕對主角,AI可謂重頭戲,發布的新品也最多。此前已多次曝光的Gemini 2.5系列,于本場大會確認6月上線,其中Gemini 2.5 Pro號稱世界上最智能的AI模型,新版本刷榜LMArena,在ELO基準測試中拿到了1448分。
Gemini 2.5 Pro新增深度思考版本,在USAMO 2025、LiveCodeBench、MMMU等多項測試中,Gemini 2.5 Pro深度思考版本表現均領先Gemini 2.5 Pro。Gemini 2.5 Flash則屬于輕量級模型,相較上一代效率提升了22%,使用的Token可減少20%到30%,資源消耗更少。
(圖源:谷歌)
Gemini 2.5系列模型新增的文本轉語音能力,可以表現出極為豐富的細節,甚至竊竊私語,適合個人創作者為影視節目配音。
谷歌還帶來了文本擴散模型Gemini Diffusion,采用不同于文本預測的逐步優化噪聲生成內容,在編程和數學領域表現更加出色。
基于Gemini 2.5系列模型的能力,谷歌Project Mariner也有望快速落地。該項目此前代號為Jarvis,與美漫《鋼鐵俠》中的超級人工智能系統同名,是一個可以操作瀏覽器或其他軟件的AI智能體,能夠監督多達10個同時執行的任務,并且通過用戶展示任務操作進行學習。
包括Gemini 2.5系列在內的谷歌最強AI功能和能力,也將通過AI搜索賦能到谷歌搜索。搜索引擎加入AI搜索并不稀奇,如國內互聯網巨頭百度的搜索引擎,也支持AI搜索功能,會將AI搜索生成的內容放在第一位。谷歌AI搜索將加入圖表生成、票務查找,甚至展現視頻、地圖等信息,提供的內容更加豐富,相較傳統搜索模式的優勢也更大。
(圖源:谷歌)
可能是與OpenAI杠上的原因,谷歌也展示了智能購物功能,在購買衣物時,用戶可上傳個人照片,AI會把商店里的衣服自動穿戴到照片中的人物身上,幫助用戶更直觀地了解衣服是否合身。
在多模態大模型Gemini 2.5系列之外,谷歌還發布了文生圖模型Imagen 4和視頻生成模型Veo 3。Imagen 4不僅生成圖片的速度相較上一代快3到10倍,細節方面也更加豐富,能夠生成織物、水滴、動物毛發等復雜物體,而且分辨率高達2K,還可以制作賀卡、海報、漫畫。
Veo 3大幅提升了生成畫面的質量,首次支持生成帶有音頻的視頻。谷歌展示的視頻顯示,從物理模擬和口型對照,Veo 3都表現出了驚人的效果。
集合視頻生成模型Veo、圖像生成模型Imagen、多模態模型Gemini于一體的應用Flow,則是谷歌專為內容創作者打造的AI電影創作應用。據谷歌介紹,Flow可以通過輸入文字或導入素材創作視頻,并通過Gemini對于自然語言的理解微調視頻,能夠將電影創作從專業場景變成任何人都可以輕易上手的工作。面向B端市場的Flow,未來能力不斷增強后,或許可以顛覆傳統影視劇制作模式。
(圖源:谷歌)
Flow將率先向美國本土谷歌AI Pro和AI Ultra用戶推送,后續面向全球用戶推送。至于價格,AI Pro每月19.99美元(當前約合人民幣144元),AI Ultra每月249.99美元(約合人民幣1801元),站在國內消費者的角度上來看,AI Pro和AI Ultra過于昂貴。
2022年GPT-3引爆AI行業,至今已過去了大約兩年半時間,AI大模型的能力飛速提升。到今天,AI行業已經進入「能力變現」的關鍵時期。本屆I/O開發者大會上,谷歌發布了多款AI大模型,但主題并非強調AI大模型的能力,而是著重解讀AI大模型的應用場景,目的或許在于將AI大模型進一步推向市場,增強AI業務的營收能力。
XR:構建統一生態,優化交互邏輯
谷歌與三星聯手開發的安卓XR平臺去年項目公布后,已獲得了數百家軟件開發商的支持。I/O開發者大會上,基于該平臺的首款XR設備——三星Project Moohan亮相。該產品類似蘋果Vision Pro,搭載驍龍XR2 Plus Gen 2芯片,無需連接PC或其他設備,能夠獨立運行,將于今年晚些時候發售。
基于安卓XR平臺的第二款設備,是中國企業Xreal開發的Project Aura,該產品也在I/O開發者大會上發布,是首款安卓XR平臺的AR眼鏡。這款產品搭載高通驍龍處理器,具體型號未知,支持光學透視(OST),也能提供虛擬透視(VST)的沉浸式體驗。
這兩款產品最值得關注的,是首個基于Gemini的安卓XR平臺。谷歌表示,與AI深度融合的安卓XR平臺,支持第一人稱視角智能輔助和無接觸輔助功能,用戶可通過自然語言與設備交互,完成信息查詢、日程管理、實時導航等操作。例如在XR設備之上,用戶可以與Gemini談論看到的一切現實世界或屏幕顯示的內容。
(圖源:谷歌)
站在消費者的角度,XR設備的主要問題在于應用生態少、交互不方便、續航時間短。
谷歌充分發揮了安卓平臺積累的優勢,與三星聯手打造的安卓XR平臺已獲得數百家軟件開發商支持,有望統一非蘋果XR設備的系統生態。建立統一生態后,軟件開發者無需為不同XR品牌單獨開發和適配應用,能夠降低成本,增加利潤空間,更有為XR設備開發軟件的積極性。
Gemini的加入,進一步優化了XR設備的交互邏輯,對于自然語義理解能力的提升,令其能夠實現「全場景可見即可說」。
軟件層面可以解決的問題,谷歌都在嘗試解決,功能更豐富的XR設備,有望一改銷量下滑的趨勢。但XR設備距離取代手機,成為下一代計算平臺依然遙遠,性能、續航等問題,仍待芯片和電池廠商解決。
安卓16:Live Updates上線,谷歌效仿蘋果?
在AI大模型和安卓XR平臺、設備之外,谷歌還公布了Wear OS 6和安卓16的部分功能和特性。Wear OS 6融合了Material 3 Expressive設計語言,更適合圓形屏幕,系統引入了動態色彩主題。谷歌推出了全新API,幫助開發者設計表盤。不過Wear OS是閉源系統,廠商難以隨意更改,國內消費者可選運的行Wear OS的產品不多。
安卓16在I/O開發者大會上公布的消息較少,主要圍繞Live Updates功能。該功能與蘋果的Live Activities相似,可以通過進度條的形式,顯示導航、外賣配送、網約車狀態等信息。
(圖源:谷歌)
國內消費者對這些功能大概不陌生,OPPO、vivo、小米、榮耀等品牌的國產旗艦,已陸續加入了進度條顯示部分App狀態的功能。
在此前召開的The Android Show活動中,負責Pixel和安卓系統UI的谷歌產品管理總監Allen Huang確認,安卓16穩定版將于6月發布?;蛟S是與I/O開發者大會時間相隔不長,此次谷歌沒有透露太多安卓16的消息,國內消費者們還需要等待一段時間。
按照之前安卓16測試版披露的信息,安卓16將支持桌面模式,在安全性、UI、相機、穩定性、加載模式、大屏適配等方面均有所升級。
另外,谷歌在I/O大會上公布了為安卓手機打造的全能AI助手Project Astra。Astra能夠根據使用場景和用戶的要求,主動制定解決方案并采取行動。模擬屏幕點擊和滑動操作的特性,表明其可能基于多模態Gemini Nano模型的視覺識別能力。
國內外主流手機廠商都在測試手機跨應用操作,國內廠商已經適配了部分應用,Astra的方案可能無法做到一步到位和快速操作,但更具普適性,無需與應用一對一適配。
AI、XR步入成熟期,但盈利依然困難
經過多年發展,AI、XR行業正從成長期向成熟期邁進,產品更加注重實用性。本次I/O大會,谷歌發布的眾多AI大模型,包括上文未提到的端側多模態模型Gemma 3n和基于Gemma 3架構的開源醫療模型MedGemma,均從實用角度出發,與搜索引擎、安卓XR、安卓16深度融合。
(圖源:谷歌)
不過AI和XR兩大行業的頭部企業,短時間內依然難以實現盈利。互聯網大廠都在投入巨資建設數據中心,未來兩三年投入大概率大于營收,但現階段的虧損是為了打造體驗更好的產品,與競爭對手一較高下,并贏得消費者的認可。
XR行業的困境則在于,生態建設、續航和性能的提升需要時間。數百家軟件開發商與谷歌合作,與手機行業數不清的軟件開發商相比,還是太少了。即便有他們的支持,安卓XR平臺也需要數年時間建設軟件生態。續航的提升,要看新型電池技術的應用,性能的提升則仰賴高通和聯發科等芯片廠商。
除了三星和XREAL,Gentle Monster、Warby Parker等眼鏡品牌也將與谷歌合作,打造基于安卓XR的產品。入場企業越來越多,相信谷歌和開發者會加快構建XR生態的速度,滿足更多消費者的需求,量產規模擴大并平攤研發成本后,XR設備的價格可能也會下降。虧損多年的XR眼鏡廠商,即便無法扭虧為盈,也將有機會收窄虧損幅度。
至于安卓16系統的具體功能,靜待下個月的谷歌發布會吧。Project Astra僅僅是首秀,雖然谷歌已經打磨了很長時間,但我們恐怕仍難以在安卓16上看到該功能,不必抱有太高期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.