99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

3070起跑,可本地運行的 Gemma 3 ,破產開發者福音

0
分享至

來源:機器之心

谷歌 Gemma 3 上線剛剛過去一個月,現在又出新版本了。


該版本經過量化感知訓練(Quantization-Aware Training,QAT)優化,能在保持高質量的同時顯著降低內存需求。


比如經過 QAT 優化后,Gemma 3 27B 的 VRAM 占用量可以從 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消費級 GPU 上本地運行!



Chatbot Arena Elo 得分:更高的分數(最上面的數字)表明更大的用戶偏好。點表示模型使用 BF16 數據類型運行時所需的 NVIDIA H100 GPU 預估數量。

機器之心在一臺配備了 RTX 3070 的電腦上簡單測試了其中的 12B 版本,可以看到雖然 Gemma 3 的 token 輸出速度不夠快,但整體來說還算可以接受。


基于量化感知訓練的 Gemma 3

在 AI 模型中,研究者可以使用更少的位數例如 8 位(int8)甚至 4 位(int4)進行數據存儲。

采用 int4 量化意味著每個數值僅用 4 bit 表示 —— 相比 BF16 格式,數據大小縮減至 1/4。

但是,這種量化方式通常會導致模型性能下降。

那谷歌是如何保持模型質量的?答案是采用 QAT。

與傳統在模型訓練完成后才進行量化的方式不同,QAT 將量化過程直接融入訓練階段 —— 通過在訓練中模擬低精度運算,使模型在后續被量化為更小、更快的版本時,仍能保持準確率損失最小化。

具體實現上,谷歌基于未量化的 checkpoint 概率分布作為目標,進行了約 5,000 步的 QAT 訓練。當量化至 Q4_0(一種常見的量化格式) 時,困惑度下降了 54%。

這樣帶來的好處之一是加載模型權重所需的 VRAM 大幅減少:

  • Gemma 3 27B:從 54 GB(BF16)降至僅 14.1 GB(int4)

  • Gemma 3 12B:從 24 GB(BF16)縮減至僅 6.6 GB(int4)

  • Gemma 3 4B:從 8 GB(BF16)精簡至 2.6 GB(int4)

  • Gemma 3 1B:從 2 GB(BF16)降至僅 0.5 GB(int4)



此圖僅表示加載模型權重所需的 VRAM。運行該模型還需要額外的 VRAM 用于 KV 緩存,該緩存存儲有關正在進行的對話的信息,并取決于上下文長度。

現在看來,用戶在消費級設備上就能運行更大、更強的 Gemma 3 模型,其中:

  • Gemma 3 27B (int4):現在可以輕松安裝在單張 NVIDIA RTX 3090(24GB VRAM)或類似顯卡上,本地就能運行最大的 Gemma 3 版本;

  • Gemma 3 12B (int4):可在 NVIDIA RTX 4060 GPU(8GB VRAM)等筆記本電腦 GPU 上高效運行,為便攜式設備帶來強大的 AI 功能;

  • 更小的型號(4B、1B):為資源較為有限的系統(包括手機和烤面包機)提供更強大的可訪問性。



來自 Two Minute Papers 頻道的玩笑

官方 int4 和 Q4_0 非量化 QAT 模型已在 Hugging Face 和 Kaggle 上線。谷歌還與眾多熱門開發者工具合作,讓用戶無縫體驗基于 QAT 的量化 checkpoint:

  • Ollama:從今天起,只需一個簡單命令即可原生支持 Gemma 3 QAT 模型。

  • LM Studio:通過用戶友好界面,輕松下載并在桌面上運行 Gemma 3 QAT 模型。

  • MLX:利用 MLX 在蘋果芯片上對 Gemma 3 QAT 模型進行高效推理。

  • Gemma.cpp:使用專用的 C++ 實現,直接在 CPU 上進行高效推理。

  • llama.cpp:得益于對 GGUF 格式 QAT 模型的原生支持,可輕松集成到現有工作流程中。

激動的網友已經無法抑制內心的喜悅:「我的 4070 就能運行 Gemma 3 12B,這次谷歌終于為即將破產的開發者做了一些事情。」


「希望谷歌朝著 1bit 量化使使勁。」


這個可以本地運行的 Gemma 3 你用了嗎,效果如何,歡迎大家評論區留言。


參考鏈接:https://developers.googleblog.com/en/gemma-3-quantized-aware-trained-state-of-the-art-ai-to-consumer-gpus/?linkId=14034718

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
600415,“大牛股”盤中跌停!發生了什么

600415,“大牛股”盤中跌停!發生了什么

新浪財經
2025-06-27 16:49:07
里夫斯拒四年8920萬續約:明夏可追五年2.46億 湖媒直言該交易他

里夫斯拒四年8920萬續約:明夏可追五年2.46億 湖媒直言該交易他

顏小白的籃球夢
2025-06-27 00:54:08
2025溫網女單簽表公布!鄭欽文首輪遇苦主,王欣瑜首輪穆霍娃

2025溫網女單簽表公布!鄭欽文首輪遇苦主,王欣瑜首輪穆霍娃

女網連連看
2025-06-27 20:30:13
“假球”都解釋不了,中國三人男籃闖進世界杯8強,劇情太狗血

“假球”都解釋不了,中國三人男籃闖進世界杯8強,劇情太狗血

真理是我親戚
2025-06-27 15:27:29
二道販子太可惡!小米yu7閑魚訂單鋪天蓋地,雷總管管吧

二道販子太可惡!小米yu7閑魚訂單鋪天蓋地,雷總管管吧

牛斯克
2025-06-27 09:31:18
張學良兒子張閭琳辭世:9歲赴美,娶陳濟棠侄女,所生兩子皆成才

張學良兒子張閭琳辭世:9歲赴美,娶陳濟棠侄女,所生兩子皆成才

柳絮憶史
2025-06-17 08:35:03
追求標準答案危害無窮

追求標準答案危害無窮

水寒說語文
2025-06-26 17:30:16
緊急避雷!“毒兒童牙膏”相繼曝光,絕非危言聳聽,家長速自查!

緊急避雷!“毒兒童牙膏”相繼曝光,絕非危言聳聽,家長速自查!

阿傖說事
2025-06-26 08:02:00
你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技
2025-06-25 16:18:11
這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

素衣讀史
2025-06-21 14:13:38
硅谷殺妻案背后:于軒一從沒有被愛過,對方一直與前女友藕斷絲連

硅谷殺妻案背后:于軒一從沒有被愛過,對方一直與前女友藕斷絲連

史行途
2025-06-27 18:32:58
貝佐斯夫婦威尼斯婚禮歡迎晚宴賓客們, 小李子,卡戴珊家族等人

貝佐斯夫婦威尼斯婚禮歡迎晚宴賓客們, 小李子,卡戴珊家族等人

老吳教育課堂
2025-06-27 15:55:43
中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

Steam社區
2025-06-26 11:57:21
月薪3萬offer,進去半年就廢了?高薪陷阱,正在毀掉一批年輕人…

月薪3萬offer,進去半年就廢了?高薪陷阱,正在毀掉一批年輕人…

火山詩話
2025-06-26 16:49:29
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
今年養老金調整有點“小意外”,通知要7月公布嗎?誰能漲的多?

今年養老金調整有點“小意外”,通知要7月公布嗎?誰能漲的多?

小舟談歷史
2025-06-26 08:44:01
李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

檸檬有娛樂
2025-06-27 10:13:46
補助標準99元/人,今年全國老年人免費健康體檢項目再擴容

補助標準99元/人,今年全國老年人免費健康體檢項目再擴容

每日經濟新聞
2025-06-26 21:32:42
我媽和二嬸不對付,鄰居蓋房占地二嬸吵不贏,我媽擼起袖子沖上去

我媽和二嬸不對付,鄰居蓋房占地二嬸吵不贏,我媽擼起袖子沖上去

多多故事薈
2025-06-10 09:10:03
李月汝首發狂砍15+10,主帥稱贊表現出色

李月汝首發狂砍15+10,主帥稱贊表現出色

發財西瓜
2025-06-27 12:25:38
2025-06-27 21:40:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

教育
旅游
本地
藝術
公開課

教育要聞

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 克什克腾旗| 美姑县| 鄂尔多斯市| 河源市| 望奎县| 莆田市| 满洲里市| 吉木萨尔县| 轮台县| 广宗县| 永德县| 内黄县| 类乌齐县| 泽库县| 永平县| 遂宁市| 岳阳县| 临湘市| 岢岚县| 准格尔旗| 河曲县| 甘泉县| 兴安县| 石首市| 龙泉市| 阳原县| 元谋县| 炉霍县| 长泰县| 从江县| 砀山县| 庆云县| 东辽县| 个旧市| 根河市| 牟定县| 山阴县| 长宁县| 洮南市| 黄冈市| 香河县|