99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

3070起跑,可本地運行的 Gemma 3 ,破產開發者福音

0
分享至

來源:機器之心

谷歌 Gemma 3 上線剛剛過去一個月,現在又出新版本了。


該版本經過量化感知訓練(Quantization-Aware Training,QAT)優化,能在保持高質量的同時顯著降低內存需求。


比如經過 QAT 優化后,Gemma 3 27B 的 VRAM 占用量可以從 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消費級 GPU 上本地運行!



Chatbot Arena Elo 得分:更高的分數(最上面的數字)表明更大的用戶偏好。點表示模型使用 BF16 數據類型運行時所需的 NVIDIA H100 GPU 預估數量。

機器之心在一臺配備了 RTX 3070 的電腦上簡單測試了其中的 12B 版本,可以看到雖然 Gemma 3 的 token 輸出速度不夠快,但整體來說還算可以接受。


基于量化感知訓練的 Gemma 3

在 AI 模型中,研究者可以使用更少的位數例如 8 位(int8)甚至 4 位(int4)進行數據存儲。

采用 int4 量化意味著每個數值僅用 4 bit 表示 —— 相比 BF16 格式,數據大小縮減至 1/4。

但是,這種量化方式通常會導致模型性能下降。

那谷歌是如何保持模型質量的?答案是采用 QAT。

與傳統在模型訓練完成后才進行量化的方式不同,QAT 將量化過程直接融入訓練階段 —— 通過在訓練中模擬低精度運算,使模型在后續被量化為更小、更快的版本時,仍能保持準確率損失最小化。

具體實現上,谷歌基于未量化的 checkpoint 概率分布作為目標,進行了約 5,000 步的 QAT 訓練。當量化至 Q4_0(一種常見的量化格式) 時,困惑度下降了 54%。

這樣帶來的好處之一是加載模型權重所需的 VRAM 大幅減少:

  • Gemma 3 27B:從 54 GB(BF16)降至僅 14.1 GB(int4)

  • Gemma 3 12B:從 24 GB(BF16)縮減至僅 6.6 GB(int4)

  • Gemma 3 4B:從 8 GB(BF16)精簡至 2.6 GB(int4)

  • Gemma 3 1B:從 2 GB(BF16)降至僅 0.5 GB(int4)



此圖僅表示加載模型權重所需的 VRAM。運行該模型還需要額外的 VRAM 用于 KV 緩存,該緩存存儲有關正在進行的對話的信息,并取決于上下文長度。

現在看來,用戶在消費級設備上就能運行更大、更強的 Gemma 3 模型,其中:

  • Gemma 3 27B (int4):現在可以輕松安裝在單張 NVIDIA RTX 3090(24GB VRAM)或類似顯卡上,本地就能運行最大的 Gemma 3 版本;

  • Gemma 3 12B (int4):可在 NVIDIA RTX 4060 GPU(8GB VRAM)等筆記本電腦 GPU 上高效運行,為便攜式設備帶來強大的 AI 功能;

  • 更小的型號(4B、1B):為資源較為有限的系統(包括手機和烤面包機)提供更強大的可訪問性。



來自 Two Minute Papers 頻道的玩笑

官方 int4 和 Q4_0 非量化 QAT 模型已在 Hugging Face 和 Kaggle 上線。谷歌還與眾多熱門開發者工具合作,讓用戶無縫體驗基于 QAT 的量化 checkpoint:

  • Ollama:從今天起,只需一個簡單命令即可原生支持 Gemma 3 QAT 模型。

  • LM Studio:通過用戶友好界面,輕松下載并在桌面上運行 Gemma 3 QAT 模型。

  • MLX:利用 MLX 在蘋果芯片上對 Gemma 3 QAT 模型進行高效推理。

  • Gemma.cpp:使用專用的 C++ 實現,直接在 CPU 上進行高效推理。

  • llama.cpp:得益于對 GGUF 格式 QAT 模型的原生支持,可輕松集成到現有工作流程中。

激動的網友已經無法抑制內心的喜悅:「我的 4070 就能運行 Gemma 3 12B,這次谷歌終于為即將破產的開發者做了一些事情。」


「希望谷歌朝著 1bit 量化使使勁。」


這個可以本地運行的 Gemma 3 你用了嗎,效果如何,歡迎大家評論區留言。


參考鏈接:https://developers.googleblog.com/en/gemma-3-quantized-aware-trained-state-of-the-art-ai-to-consumer-gpus/?linkId=14034718

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廈航回應將旅客從商務艙降至經濟艙:因天氣原因機型調整,會退差價

廈航回應將旅客從商務艙降至經濟艙:因天氣原因機型調整,會退差價

環球網資訊
2025-05-09 14:42:20
乘機赴俄被愛沙尼亞禁止飛越領空,斯洛伐克總理發聲:蓄意破壞行為

乘機赴俄被愛沙尼亞禁止飛越領空,斯洛伐克總理發聲:蓄意破壞行為

環球網資訊
2025-05-08 13:28:29
淚流滿面的發帖!爺爺每多活一天,就能為家里帶來566元的收入…

淚流滿面的發帖!爺爺每多活一天,就能為家里帶來566元的收入…

火山詩話
2025-05-09 14:23:17
美國將改變芯片出口三級管制,美芯片巨頭AMD高管:中國為芯片市場和AI產業帶來“巨大機遇”

美國將改變芯片出口三級管制,美芯片巨頭AMD高管:中國為芯片市場和AI產業帶來“巨大機遇”

環球網資訊
2025-05-09 06:56:31
殲-20被擊落的背后:從演習看未來空戰法則

殲-20被擊落的背后:從演習看未來空戰法則

小宇宙雙色球
2025-05-09 09:41:43
這一仗,打慘了印度,打醒了美國,打哭了法國,打出了中國的威望

這一仗,打慘了印度,打醒了美國,打哭了法國,打出了中國的威望

書中自有顏如玉
2025-05-09 06:17:52
活久見!走路也躺槍,青島一老人轉身被撞骨折,向行人索賠18.8萬

活久見!走路也躺槍,青島一老人轉身被撞骨折,向行人索賠18.8萬

火山詩話
2025-05-09 06:22:03
《群狼》才發行幾天,不知火舞果體mod都出來了,老玩家怒不可遏

《群狼》才發行幾天,不知火舞果體mod都出來了,老玩家怒不可遏

街機時代
2025-05-08 15:00:03
中方與美方會談后,特朗普言辭激烈,隨即傳來壞消息。

中方與美方會談后,特朗普言辭激烈,隨即傳來壞消息。

世界有奇事
2025-05-08 17:26:19
5月9日CBA總決賽三消息,朱俊龍傷情,G2裁判全換,楊鳴換搭檔

5月9日CBA總決賽三消息,朱俊龍傷情,G2裁判全換,楊鳴換搭檔

浪子阿邴聊體育
2025-05-09 09:49:47
東體:特謝拉已向全隊道歉,他此前累計的三張黃牌沒有消掉

東體:特謝拉已向全隊道歉,他此前累計的三張黃牌沒有消掉

直播吧
2025-05-09 11:41:07
郭艾倫:如果重新選擇不會再帶傷復出,腿筋拉傷對生涯影響太大了

郭艾倫:如果重新選擇不會再帶傷復出,腿筋拉傷對生涯影響太大了

雷速體育
2025-05-08 21:38:13
我離婚9年,出差路過前妻老家,順路看望岳父,推開門后我愣住了

我離婚9年,出差路過前妻老家,順路看望岳父,推開門后我愣住了

獅拓一葉知秋
2025-05-05 23:27:14
陳坤兒子已成年,容貌開始顯現出生母基因。像誰認得出來嗎?

陳坤兒子已成年,容貌開始顯現出生母基因。像誰認得出來嗎?

喜歡歷史的阿繁
2025-05-07 12:40:33
人民日報怒批!戳穿了胖東來“屢犯”的真相,于東來刪除邀請視頻

人民日報怒批!戳穿了胖東來“屢犯”的真相,于東來刪除邀請視頻

削桐作琴
2025-05-08 19:12:42
失去周琦三家,兩家變法貶周琦,一家沒貶

失去周琦三家,兩家變法貶周琦,一家沒貶

大眼瞄世界
2025-05-09 08:54:16
兩場末節12中1,卻拿3.5億頂薪!季后賽退步最快超巨,你該出局了

兩場末節12中1,卻拿3.5億頂薪!季后賽退步最快超巨,你該出局了

老梁體育漫談
2025-05-09 00:05:22
專家說對了!我國二三十層電梯房,未來或將面臨同一個結局

專家說對了!我國二三十層電梯房,未來或將面臨同一個結局

靚仔情感
2025-05-08 09:26:32
莫斯科再現蘇聯軍隊攻入柏林國會大廈場景

莫斯科再現蘇聯軍隊攻入柏林國會大廈場景

中國青年報
2025-05-05 19:48:12
美商務部長:美國將在下月推出數十項貿易協議,期待與中國關系緩和

美商務部長:美國將在下月推出數十項貿易協議,期待與中國關系緩和

金融界
2025-05-09 13:37:52
2025-05-09 16:12:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
2949文章數 11008關注度
往期回顧 全部

科技要聞

奧特曼:不怕中國趕上 就怕美國犯愚蠢錯誤

頭條要聞

普雷沃斯特當選新一任教皇 外交部回應

頭條要聞

普雷沃斯特當選新一任教皇 外交部回應

體育要聞

對話薩維奧拉:希望中國能有更多武磊出現

娛樂要聞

張柏芝把鋒菲戀的體面徹底踩在了腳下

財經要聞

美英達成貿易協議!

汽車要聞

絕對能省心過日子 榮威D6滿足家用車三大標準

態度原創

手機
游戲
時尚
旅游
軍事航空

手機要聞

等等黨狂喜!紅魔電競新品要來了,又一驍龍8至尊小平板!

《軒轅劍3》Switch日版再度跳票 這下比NS2還晚了

20~60歲穿都美!這件無齡感上衣太絕了

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

加沙多地遭襲 巴武裝人員與以軍激烈戰斗

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 铜山县| 贺州市| 寿光市| 青岛市| 深州市| 大冶市| 东城区| 鄂州市| 洛浦县| 白玉县| 博客| 法库县| 博兴县| 扶绥县| 白水县| 海兴县| 延吉市| 巫山县| 宾川县| 蓬安县| 林周县| 罗甸县| 剑川县| 舟曲县| 刚察县| 两当县| 甘洛县| 汉源县| 清丰县| 龙川县| 上蔡县| 全椒县| 安泽县| 德令哈市| 城市| 都兰县| 富源县| 洮南市| 阿坝县| 阿城市| 兴海县|