99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌開源Gemma 3n:2G內存就能跑,100億參數(shù)內最強多模態(tài)模型

0
分享至

機器之心報道

編輯:澤南

端側設備迎來了新架構的 AI 模型。

本周五凌晨,谷歌正式發(fā)布、開源了全新端側多模態(tài)大模型 Gemma 3n。



  • 模型、權重:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4
  • 文檔:https://ai.google.dev/gemma/docs/gemma-3n
  • 博客:https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/

谷歌表示,Gemma 3n 代表了設備端 AI 的重大進步,它為手機、平板、筆記本電腦等端側設備帶來了強大的多模式功能,其性能去年還只能在云端先進模型上才能體驗。

Gemma 3n 的特性包含如下幾個方面:

  • 多模態(tài)設計:Gemma 3n 原生支持圖像、音頻、視頻和文本輸入和文本輸出。
  • 專為設備端優(yōu)化:Gemma 3n 型號以效率為設計重點,提供兩種基于有效參數(shù)尺寸:E2B 和 E4B。雖然它們的原始參數(shù)數(shù)量分別為 5B 和 8B,但架構創(chuàng)新使其運行內存占用與傳統(tǒng)的 2B 和 4B 型號相當,僅需 2GB (E2B) 和 3GB (E4B) 內存即可運行。
  • 架構突破:Gemma 3n 的核心是全新組件,例如用于計算靈活性的 MatFormer 架構、用于提高內存效率的每層嵌入 (PLE) 以及針對設備用例優(yōu)化的新型音頻和基于 MobileNet-v5 的視覺編碼器。
  • 質量提升:Gemma 3n 在多語言(支持 140 種文本語言和 35 種語言的多模態(tài)理解)、數(shù)學、編碼和推理方面均實現(xiàn)了質量提升。E4B 版本的 LMArena 得分超過 1300,使其成為首個達到此基準的 100 億參數(shù)以下模型。



谷歌表示,要想實現(xiàn)設備性能的飛躍需要徹底重新思考模型。Gemma 3n 獨特的移動優(yōu)先架構是其基礎,而這一切都始于 MatFormer。

MatFormer:一種型號,多種尺寸

Gemma 3n 的核心是 MatFormer(Matryoshka Transformer) 架構,這是一種專為彈性推理而構建的新型嵌套 Transformer。你可以將其想象成俄羅斯套娃:一個較大的模型包含其自身更小、功能齊全的版本。這種方法將俄羅斯套娃表征學習的概念從單純的嵌入擴展到所有 Transformer 組件。



因此,MatFormer 在訓練 4B 有效參數(shù) (E4B) 模型時,會同時優(yōu)化 2B 有效參數(shù) (E2B) 子模型,如上圖所示。這為開發(fā)者提供了兩項強大的功能和用例:

  1. 預提取模型:開發(fā)者可以直接下載并使用 E4B 模型以獲得更高性能,或者使用已提取的獨立 E2B 子模型,提供兩倍更快的推理速度。
  2. 使用 Mix-n-Match 自定義尺寸:為了根據(jù)特定硬件限制進行更精細的控制,你可以使用谷歌稱之為 Mix-n-Match 的方法,在 E2B 和 E4B 之間創(chuàng)建一系列自定義尺寸的模型。這項技術允許人們精確地對 E4B 模型的參數(shù)進行切片,主要通過調整每層的前饋網(wǎng)絡隱藏層維度(從 8192 到 16384)并選擇性地跳過某些層來實現(xiàn)。谷歌還將發(fā)布 MatFormer Lab,以展示如何檢索這些最佳模型,這些模型是通過在 MMLU 等基準測試中評估各種設置而確定的。



不同模型大小的預訓練 Gemma 3n 的 MMLU 分數(shù)(使用 Mix-n-Match)。

展望未來,MatFormer 架構也為彈性執(zhí)行鋪平了道路。雖然此功能不屬于今天發(fā)布的實現(xiàn),但它允許單個部署的 E4B 模型在 E4B 和 E2B 推理路徑之間動態(tài)切換,從而根據(jù)當前任務和設備負載實時優(yōu)化性能和內存使用情況。

每層嵌入(PLE):釋放更多內存效率

Gemma 3n 模型采用了逐層嵌入 (PLE) 技術。這項創(chuàng)新專為設備部署而設計,可大幅提高模型質量,同時不會增加設備加速器 (GPU/TPU) 所需的高速內存占用。

雖然 Gemma 3n E2B 和 E4B 模型的總參數(shù)數(shù)量分別為 5B 和 8B,但 PLE 允許很大一部分參數(shù)(與每層相關的嵌入)在 CPU 上加載并高效計算。這意味著只有核心 Transformer 權重(E2B 約為 2B,E4B 約為 4B)需要存儲在通常較為受限的加速器內存 (VRAM) 中。



通過每層嵌入,你可以使用 Gemma 3n E2B,同時僅在 AI 加速器中加載約 2B 個參數(shù)。

KV Cache 共享:更快的長上下文處理

處理長內容輸入(例如來自音頻和視頻流的序列)對于許多先進的設備端多模態(tài)應用至關重要。Gemma 3n 引入了鍵值緩存共享 (KV Cache Sharing),旨在加快流式響應應用的首個 token 獲取時間 (Time-to-first-token)。

KV Cache Sharing 優(yōu)化了模型處理初始輸入處理階段(通常稱為「預填充」階段)的方式。來自局部和全局注意力機制的中間層的鍵和值將直接與所有頂層共享,與 Gemma 3 4B 相比,預填充性能顯著提升了兩倍。這意味著模型能夠比以往更快地提取和理解較長的提示序列。

音頻理解:將語音引入文本并進行翻譯

在語音方面,Gemma 3n 采用基于通用語音模型(USM)的高級音頻編碼器。該編碼器每 160 毫秒的音頻生成一個 token(約每秒 6 個 token),然后將其作為語言模型的輸入進行集成,從而提供聲音上下文的精細表示。

這種集成音頻功能為設備開發(fā)解鎖了關鍵功能,包括:

  • 自動語音識別 (ASR):直接在設備上實現(xiàn)高質量的語音到文本的轉錄。
  • 自動語音翻譯 (AST):將口語翻譯成另一種語言的文本。

經過實踐可知,Gemma 3n 在英語與西班牙語、法語、意大利語、葡萄牙語之間的翻譯 AST 效果尤為出色。對于語音翻譯等任務,利用「思維鏈」提示可以顯著提升翻譯效果。以下是示例:

userTranscribe the following speech segment in Spanish, then translate it into English:

model

Gemma 3n 編碼器在發(fā)布時已可以處理長達 30 秒的音頻片段,但這并非極限。底層音頻編碼器是一個流式編碼器,能夠通過額外的長音頻訓練處理任意長度的音頻。后續(xù)的實現(xiàn)將解鎖低延遲、長流式傳輸應用程序。

MobileNet-V5:最先進的視覺編碼器

除了集成的音頻功能外,Gemma 3n 還配備了全新的高效視覺編碼器 MobileNet-V5-300M,為邊緣設備上的多模態(tài)任務提供最先進的性能。

MobileNet-V5 專為在受限硬件上實現(xiàn)靈活性和強大功能而設計,可為開發(fā)人員提供:

  • 多種輸入分辨率:本機支持 256×256、512×512 和 768×768 像素的分辨率,讓開發(fā)者能夠平衡特定應用的性能和細節(jié)。
  • 通用的視覺理解:在廣泛的多模式數(shù)據(jù)集上進行了聯(lián)合訓練,在各種圖像和視頻理解任務中表現(xiàn)出色。
  • 高吞吐量:在 Google Pixel 上每秒處理高達 60 幀,實現(xiàn)實時設備視頻分析和交互式體驗。

這一性能水平是通過多種架構創(chuàng)新實現(xiàn)的,其中包括:

  • MobileNet-V4 模塊的高級基礎(包括 Universal Inverted Bottlenecks 和 Mobile MQA)。
  • 顯著擴大的架構,采用混合深度金字塔模型,比最大的 MobileNet-V4 變體大 10 倍。
  • 一種新的多尺度融合 VLM 適配器,可提高 token 質量,從而提高準確性和效率。

得益于新架構設計和先進蒸餾技術,MobileNet-V5-300M 在 Gemma 3 中的表現(xiàn)顯著優(yōu)于基線 SoViT(使用 SigLip 訓練,未進行蒸餾)。在 Google Pixel Edge TPU 上,它在量化的情況下實現(xiàn)了 13 倍的加速(不使用量化的情況下為 6.5 倍),所需參數(shù)減少了 46%,內存占用減少了 4 倍,同時在視覺語言任務上實現(xiàn)了更高的準確率。

谷歌表示,更多細節(jié)會在即將發(fā)布的 MobileNet-V5 技術報告中展示。

5 月 20 日,谷歌 DeepMind 在 I/O 大會上宣布了 Gemma-3n,其小體量、高性能和低內存占用的特性讓人印象深刻。

谷歌的首個 Gemma 模型于去年年初發(fā)布,目前該系列的累計下載量已經超過了 1.6 億次。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
高考288分全家歡呼后續(xù):中考成績被扒出,女孩被網(wǎng)暴痛哭刪視頻

高考288分全家歡呼后續(xù):中考成績被扒出,女孩被網(wǎng)暴痛哭刪視頻

叨嘮
2025-06-27 03:05:17
扁擔女孩成績出爐第2天,扎心的一幕出現(xiàn)了,班主任回應話里有話

扁擔女孩成績出爐第2天,扎心的一幕出現(xiàn)了,班主任回應話里有話

古希臘掌管松餅的神
2025-06-27 10:45:32
首富婚禮第一天全球商政名流云集,貝佐斯笑到露牙花,桑切斯太美

首富婚禮第一天全球商政名流云集,貝佐斯笑到露牙花,桑切斯太美

小嵩
2025-06-27 11:07:42
日本前空姐:年薪不到2000萬的乘客,根本沒資格給我遞名片!

日本前空姐:年薪不到2000萬的乘客,根本沒資格給我遞名片!

瑪麗姬絲
2025-06-26 18:36:53
1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

揚子晚報
2025-06-27 10:38:28
美公布打擊伊朗巨型鉆地彈試爆畫面

美公布打擊伊朗巨型鉆地彈試爆畫面

大象新聞
2025-06-27 09:39:01
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
相機鋰電池無3C標識不能過檢?北京上海機場:相機電池要求不變

相機鋰電池無3C標識不能過檢?北京上海機場:相機電池要求不變

新京報
2025-06-27 13:43:41
古人為什么用豆蔻形容少女?直到了解豆蔻是什么:實在是太形象了

古人為什么用豆蔻形容少女?直到了解豆蔻是什么:實在是太形象了

大千世界觀
2025-06-27 08:41:52
首輪16順位,4年合同2139萬,上繳青島隊,楊瀚森還剩下多少?

首輪16順位,4年合同2139萬,上繳青島隊,楊瀚森還剩下多少?

東球弟
2025-06-26 10:37:52
杜特爾特禍從口出,活著回到菲律賓的希望,或被他親手斷送

杜特爾特禍從口出,活著回到菲律賓的希望,或被他親手斷送

博覽歷史
2025-06-27 08:10:07
瘋狂!C羅新合同曝光:日薪480萬元 2年入賬50億元 體壇史上最貴

瘋狂!C羅新合同曝光:日薪480萬元 2年入賬50億元 體壇史上最貴

風過鄉(xiāng)
2025-06-27 06:58:56
1小時大定突破28.9萬輛!雷軍:拿到這么多訂單挺激動 小米不是靠營銷贏

1小時大定突破28.9萬輛!雷軍:拿到這么多訂單挺激動 小米不是靠營銷贏

每日經濟新聞
2025-06-27 02:53:08
曝小米總監(jiān)出軌200多人,6個私生子拍多張親密照,還有美女高中生

曝小米總監(jiān)出軌200多人,6個私生子拍多張親密照,還有美女高中生

壹月情感
2025-06-26 22:26:40
當小米YU7三分鐘大訂突破20萬臺,誰會介意自己老婆長得像劉亦菲

當小米YU7三分鐘大訂突破20萬臺,誰會介意自己老婆長得像劉亦菲

電科技網(wǎng)
2025-06-26 23:05:45
安徽一女子網(wǎng)購5斤荔枝,一口氣剝完后僅退款,網(wǎng)友:氣死了

安徽一女子網(wǎng)購5斤荔枝,一口氣剝完后僅退款,網(wǎng)友:氣死了

大笑江湖史
2025-06-26 17:55:06
王思聰把價值百萬的電視和庫洛米搬到了日本,網(wǎng)友:不打算回國了

王思聰把價值百萬的電視和庫洛米搬到了日本,網(wǎng)友:不打算回國了

鑫鑫說說
2025-06-27 08:51:05
大失所望!安徽屏蔽生數(shù)據(jù)出來了,怎么六安毛坦廠一個沒有呀…

大失所望!安徽屏蔽生數(shù)據(jù)出來了,怎么六安毛坦廠一個沒有呀…

火山詩話
2025-06-27 08:59:50
難以置信!東莞一初三女生被民辦學校勸退,網(wǎng)友:也是鳳毛麟角了

難以置信!東莞一初三女生被民辦學校勸退,網(wǎng)友:也是鳳毛麟角了

火山詩話
2025-06-27 08:45:03
卡戴珊母女威尼斯之行:時尚與優(yōu)雅的完美碰撞

卡戴珊母女威尼斯之行:時尚與優(yōu)雅的完美碰撞

述家娛記
2025-06-27 08:20:24
2025-06-27 14:27:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10728文章數(shù) 142348關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

急救員回應救護車帶ECMO不用也收費:車上備這是白費

頭條要聞

急救員回應救護車帶ECMO不用也收費:車上備這是白費

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

網(wǎng)傳白玉蘭最佳男女主獎將“爆冷”

財經要聞

1萬就能刪行政處罰?信用修復江湖起底

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態(tài)度原創(chuàng)

數(shù)碼
健康
游戲
旅游
軍事航空

數(shù)碼要聞

QLC性能媲美TLC!美光推出2600 SSD:自適應寫入、7299MB/s讀速

呼吸科專家破解呼吸道九大謠言!

《輪盤獵人:命運賭局》試玩報告:內容最豐富的“俄羅斯輪盤賭”"/> 主站 商城 論壇 自運營 登錄 注冊 《輪盤獵人:命運賭局》試玩報告:內容最豐富的“...

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

美媒揭美軍37小時奔襲伊朗細節(jié)

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 施甸县| 深泽县| 古田县| 平和县| 武冈市| 基隆市| 巴南区| 马边| 永靖县| 日照市| 高安市| 常州市| 衢州市| 海淀区| 平塘县| 措勤县| 常宁市| 丹东市| 四川省| 衡水市| 浙江省| 庄河市| 志丹县| 青浦区| 玉溪市| 习水县| 林甸县| 吉林市| 昌乐县| 长寿区| 郧西县| 黑水县| 克什克腾旗| 新乡市| 惠州市| 饶平县| 蓝田县| 青川县| 涪陵区| 全椒县| 巴林右旗|