99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

微軟發布全球首個1-bit大模型：內存縮至0.4 GB，參數只有0和±1，性能追平全精度

2025-04-22 12:10:20　來源: 大數據文摘

北京舉報

0

分享至

大數據文摘出品

微軟的BitNet b1.58 2B4T 的技術報告悄然上線。

其實在開源社區里，關于極致低比特量化的大模型早就有各種傳聞，這次微軟研究院終于亮出底牌。

——全球首個原生1-bit、規模高達20億參數的開源大模型。

圖注：這張圖表明，在同等內存占用下，BitNet b1.58 2B模型取得了更高的性能分數，比當前主流開源模型更高效

別看名字有點拗口，b1.58 2B4T，背后可不簡單，這玩意不僅在性能上追平甚至部分超越同級別全精度模型，更是把內存、能耗和推理速度都拉低到令人發指的地步。

而且，模型權重直接上 Hugging Face，推理代碼 GPU、CPU 雙版本全開源，門檻之低，真是讓人有點小震撼。

01 BitNet b1.58 2B4T 到底是什么？

一句話總結：
這是世界首個原生1-bit、20億參數、性能媲美全精度的開源大模型。

大家都知道，大模型開源越來越卷，LLaMA、Qwen、Gemma、MiniCPM 各種百花齊放。但有個痛點始終沒解決——太吃資源。

于是，極致量化被推上風口——1-bit（極端比特化，只允許權重取-1、0、+1）。

說起來簡單，真要規模化落地，性能往往一落千丈，之前不是只能做小模型，就是性能掉得讓人心疼。

BitNet b1.58 2B4T 這次直接原生1-bit訓練，參數上到2B，訓練數據高達4萬億token，目標就是：

做到極致高效的同時，性能絕不妥協。

圖注：在蘋果M2 CPU上都能快速運行

02 架構和訓練怎么煉成的？

核心創新點有三：

1.BitLinear 層

用自研 BitLinear 替換掉傳統 Transformer 的全精度線性層。權重量化到1.58 bit（三值：-1、0、+1），激活也量化到8 bit。這樣不僅模型文件暴減，推理也能用比特操作加速。

2.訓練方案極致調優

預訓練用兩階段學習率+權重衰減，先大步快走，再精細收斂。
數據集涵蓋超大規模網頁、代碼、數學合成數據，兩階段分別喂不同質量的數據。
SFT（監督微調）和 DPO（直接偏好優化）全都用上，還專門調大了學習率和輪數，讓1-bit模型也能吃透任務。

3.推理實現

為了讓1.58-bit和8-bit混合矩陣乘法在GPU/CPU上都能跑起來，團隊還專門造了 CUDA kernel 和 C++ 庫，模型權重直接高效打包，能在普通筆電、服務器、邊緣設備都無壓力上線。

03 性能表現：效率+能力雙豐收

內存占用：0.4GB（非embedding部分），是同級全精度模型的1/4甚至更低。

推理延遲：29ms/Token（CPU上），比LLaMA 1B等快出一大截。

能耗：僅0.028J/Token，低到離譜。

綜合能力：平均分 54.19，逼近 Qwen2.5-1.5B（55.23），大幅超越 MiniCPM、Gemma、LLaMA 等同級模型。

單項指標：在 ARC-Challenge、GSM8K、CommonsenseQA 等關鍵任務上還反超大部分對手。

圖注：如圖所示，BitNet b1.58 2B 在內存、延遲、能耗三項指標上全面領先

更狠的是，和常見的 INT4 量化模型比，BitNet b1.58 2B4T 在內存進一步壓縮的情況下，性能反而更穩，幾乎沒有明顯損失。

而且，不只是干掉傳統PTQ量化，放到同類1-bit模型里，BitNet b1.58 2B4T 也是一騎絕塵，甚至比部分更大參數、后量化的模型還強。

04 one more thing

BitNet b1.58 2B4T 已經是1-bit模型的天花板，但團隊還留了不少懸念：

如何實現更大規模擴展（7B、13B）？
怎樣支持更長上下文，挑戰大段落、復雜推理任務？
多語言、多模態集成，讓1-bit模型也能“看圖說話”
軟硬件協同，期待新一代AI芯片為低比特模型量身定做
理論層面，1-bit訓練為啥能這么有效？還有哪些魔法值得挖掘？

附：模型和推理工具全開源

技術報告：https://arxiv.org/abs/2504.12285

GPU/CPU推理庫：https://aka.ms/bitnet

GPU算力按需租用

A100/H100 GPU算力按需租用，

秒級計費，平均節省開支30%以上！

掃碼了解詳情?

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

DeepSeek用的GRPO占用大量內存？有人給出了些破解方法

機器之心Pro 2025-02-07 14:49:06
0 跟貼 0
登頂開源大模型榜首阿里Qwen3成色如何？|聚焦

財聯社 2025-05-01 19:34:10
3 跟貼 3

DeepSeek開源數學模型Prover-V2-671B ，較上代參數量提高近百倍

DeepTech深科技 2025-04-30 21:19:02
7 跟貼 7

400萬token新SOTA！英偉達UIUC聯手：兼顧長短上下文頂尖性能

新智元 2025-05-01 09:39:50
0 跟貼 0
ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
13 跟貼 13

Claude網頁版接入MCP！10款應用一鍵調用,開發者30分鐘創建新集成

量子位 2025-05-02 18:18:26
4 跟貼 4

蘋果微軟特斯拉，最大股東都是它！

華商韜略 2024-11-27 18:03:46
1 跟貼 1
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0

清華女老師、微軟高管，敦煌網創始人做電商

每日經濟新聞 2025-04-17 14:16:14
0 跟貼 0
美股開盤集體高開，微軟大漲9%

界面新聞 2025-05-01 21:36:15
1 跟貼 1
太牛了！400塊洋垃圾，也能在本地部署DeepSeek？！

雷科技 2025-02-14 11:33:42
0 跟貼 0
知名博主吐槽Xbox漲價：兩臺主機買了5年自己升值了!

游民星空 2025-05-02 17:10:15
2 跟貼 2
微軟第三季度營收700.7億美元

界面新聞 2025-05-01 07:01:54
0 跟貼 0
別等了!外媒警告:PS5或將大漲價現在買最好！

游民星空 2025-05-02 17:10:15
3 跟貼 3
微軟宣布對歐五項數字承諾，計劃兩年內將歐洲數據中心容量提高40%

界面新聞 2025-04-30 16:35:57
0 跟貼 0
AI Phone：先是芯片，再是模型，最后才是手機廠商

鈦媒體APP 2024-11-08 19:44:25
3 跟貼 3
XBOX漲價沃爾瑪趁機參團！現在正是時候購買PS5！

游民星空 2025-05-02 18:13:17
3 跟貼 3
微軟市值一夜漲超1.6萬億元，蘋果盤后跌超4%

每日經濟新聞 2025-05-02 11:36:11
0 跟貼 0
Sakana AI推出LLM記憶管理技術NAMMs，可將內存成本降低75%

DeepTech深科技 2024-12-18 16:50:28
2 跟貼 2
小米開源首個推理大模型開出百萬元年薪“招兵買馬”

每日經濟新聞 2025-05-02 00:08:14
401 跟貼 401
中國制造顯威力！特朗普多渠道求中！印巴戰機對峙，運20挺巴鐵

人猿星球觀察 2025-05-02 09:12:53
0 跟貼 0
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
0 跟貼 0
靜悄悄的餓了么，戰斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
Xbox漲價后 Xbox Series X性價比不及PS5 Pro

3DM游戲 2025-05-02 21:09:06
12 跟貼 12
特朗普硬蹭10天說11次與中聯系！中國謀定而后動，美已先眨眼！

人猿星球觀察 2025-05-02 23:22:02
0 跟貼 0
TOC版本零消費排骨實測，來看看鐵公雞一個版本能賺多少金 #大神魔獸5月創作季# #網易大神# #魔

我在右 2025-05-02 18:08:32
7 跟貼 7
有錢人體驗三分熟牛排，吃過的才知道，肉不是生而是嫩

兩面包夾芋頭 2025-05-01 09:39:28
860 跟貼 860
中國不跪鼓勵世界也不跪！人類間最大笑話：特朗普要管理世界！

人猿星球觀察 2025-04-30 15:56:37
1 跟貼 1
你如何評價Xbox主機和游戲漲價？來談談你的看法！

游民星空 2025-05-02 20:09:08
2 跟貼 2
美企不陪特朗普鬧了，沃爾瑪：已通知中方恢復供貨，加的稅美方出

鳳凰張霆鋒 2025-04-30 17:01:18
0 跟貼 0
中國打太極，特朗普急了！卡尼、空客硬杠美國！商飛歐洲大機遇？

人猿星球觀察 2025-05-02 18:49:07
0 跟貼 0
等不及特朗普認輸，沃爾瑪請求中國立即發貨，所有關稅美國人買單

蘇浩 2025-04-30 10:03:18
0 跟貼 0
波音訂單背后的外交棋局：印度貿易策略的重心轉移與影響

誤落風塵 2025-05-01 07:03:41
0 跟貼 0
白宮震怒亞馬遜

國際風云錄 2025-05-01 08:17:09
0 跟貼 0
中方連退3架，特朗普沒耐心，24小時內通告全球：將重啟對等關稅

易老馮唐 2025-05-02 08:15:00
0 跟貼 0
大模型競技場再被錘！Llama4私下測試27個版本，只取最佳成績

量子位 2025-05-02 13:21:51
1 跟貼 1
一年虧千億，裁員2.2萬人，壟斷40年巨頭進入生死年

鈦媒體APP 2025-05-02 11:20:12
3 跟貼 3
讓美國消費者買單！沃爾瑪受不了了，“硬扛”關稅也要從中國進貨

王晉博士 2025-04-30 16:55:07
0 跟貼 0
比亞迪版圖大起底，實力超乎你的想象

華商韜略 2025-02-11 17:11:11
82 跟貼 82
不把特朗普當回事，沃爾瑪恢復從中國進口，關稅全部由美國人買單

地理三體說 2025-05-01 14:37:12
0 跟貼 0

壽命與體重的關系被發現！60歲后，體重越接近“這個數”，越長壽

壽命與體重的關系被發現！60歲后，體重越接近“這個數”，越長壽

健康八條

2025-04-28 22:17:42

小米官方限速來了！1548匹馬力被“上鎖”，車主質疑“付費性能遭閹割”

小米官方限速來了！1548匹馬力被“上鎖”，車主質疑“付費性能遭閹割”

瀟湘晨報

2025-05-02 07:46:09

5月2日俄烏：美國不再充當調解人，烏無人機大規模襲擊克里米亞

5月2日俄烏：美國不再充當調解人，烏無人機大規模襲擊克里米亞

山河路口

2025-05-02 18:13:01

大公報再次聲討李嘉誠，口吻已經發生極大變化

大公報再次聲討李嘉誠，口吻已經發生極大變化

V記錄號

2025-05-02 22:35:13

國家衛健委介入中日友好醫院醫生輿情！協和4+4項目受爭議

國家衛健委介入中日友好醫院醫生輿情！協和4+4項目受爭議

南方都市報

2025-05-01 09:35:05

中美貿易戰現轉機信號！5月3日，凌晨的三大重要消息正式傳來！

中美貿易戰現轉機信號！5月3日，凌晨的三大重要消息正式傳來！

風口招財豬

2025-05-03 01:26:52

“提供關鍵零部件支持”，美媒：美軍證實從“飛機墳場”調撥退役F-16支援烏克蘭

“提供關鍵零部件支持”，美媒：美軍證實從“飛機墳場”調撥退役F-16支援烏克蘭

環球網資訊

2025-05-02 11:51:21

烏軍開始刷積分打仗了，擊斃1名俄軍得6分，摧毀1輛坦克得40分！

烏軍開始刷積分打仗了，擊斃1名俄軍得6分，摧毀1輛坦克得40分！

凱撒談兵

2025-05-02 07:59:33

中國宣告，新冠是美惡意制造并且傳播，必須給全球一個交代

中國宣告，新冠是美惡意制造并且傳播，必須給全球一個交代

低調看天下

2025-05-02 19:45:23

深夜！人民幣狂拉，中國資產大爆發！

深夜！人民幣狂拉，中國資產大爆發！

證券時報

2025-05-02 22:54:04

趙心童創造世界紀錄，超越希金斯，對奧沙利文連贏9局歷史第一人

趙心童創造世界紀錄，超越希金斯，對奧沙利文連贏9局歷史第一人

楊華評論

2025-05-02 21:39:30

如果趙心童奪冠，下賽季重獲職業身份的他將直接進入世界前16

如果趙心童奪冠，下賽季重獲職業身份的他將直接進入世界前16

懂球帝

2025-05-03 04:40:09

熱搜第一！“每份菜3元至18元”，7000名游客擠爆政府食堂！“米飯蒸了1000多斤，每次飯一端上來就秒空，飯碗都不夠用了”

熱搜第一！“每份菜3元至18元”，7000名游客擠爆政府食堂！“米飯蒸了1000多斤，每次飯一端上來就秒空，飯碗都不夠用了”

每日經濟新聞

2025-05-02 16:00:08

盧克文：500萬白砸了！最郁悶的應該是在巴納德沒有畢業的學生

盧克文：500萬白砸了！最郁悶的應該是在巴納德沒有畢業的學生

小人物看盡人間百態

2025-05-02 14:29:39

特訊！特朗普簽署總統令，豁免25％關稅，5月3日正式生效

特訊！特朗普簽署總統令，豁免25％關稅，5月3日正式生效

智觀科技

2025-05-02 09:54:10

18場0球！英超第3人又啞火，1.3億巨星急速隕落，身價嚴重虛高

18場0球！英超第3人又啞火，1.3億巨星急速隕落，身價嚴重虛高

足球狗說

2025-05-02 14:59:39

深度：普通民眾既看不到大事的真相，也不能影響上層的決策

深度：普通民眾既看不到大事的真相，也不能影響上層的決策

子墨君

2025-05-02 23:08:06

農戶27年前承包的“荒沙地”變“天然牧草地”，因未退耕獲刑6個月，當地回應

農戶27年前承包的“荒沙地”變“天然牧草地”，因未退耕獲刑6個月，當地回應

中國能源網

2025-05-02 09:11:04

當“腫脹臉”混進央視劇，盛世美顏被打回原形，張魯一再強也沒用

當“腫脹臉”混進央視劇，盛世美顏被打回原形，張魯一再強也沒用

追風小狗

2025-04-30 22:10:42

特朗普重申：美聯儲應該降低利率

特朗普重申：美聯儲應該降低利率

財聯社

2025-05-02 20:50:07

大數據文摘

專注大數據，每日有分享！

6611文章數 94407關注度

往期回顧全部

科技要聞

微軟CEO和奧特曼失了和，OpenAI被“斷糧”

頭條要聞

美媒：馬斯克不再在白宮辦公后特朗普演講時"挖苦"他

頭條要聞

美媒：馬斯克不再在白宮辦公后特朗普演講時"挖苦"他

體育要聞

北京3-0橫掃山西晉級總決賽戰廣廈杰曼43分周琦19+11

娛樂要聞

趙又廷節目中高調撒糖大贊高圓圓超好

財經要聞

黃仁勛在美國又穿西裝表態，怎么看？

汽車要聞

全路況大格局前路山海皆坦途

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

家居

親子

藝術

公開課

海外網友熱議BLG擊敗WBG：再見wei，北川更適合！支持BLG解雇茂凱

家居要聞

意式輕奢低飽和質感美學

輕奢婚房自由隨性生活
雅奢氛圍營造品質生活
慢度設計溫暖與沉靜的體驗

親子要聞

陪伴孩子一起面對痛苦，生發其應當承擔的責任

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
全球十大恐怖禁區有哪些？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：临西县| 漳浦县| 雷山县| 龙江县| 宁德市| 东阿县| 搜索| 新安县| 荆门市| 神农架林区| 息烽县| 梧州市| 麻城市| 丰城市| 进贤县| 宁武县| 五家渠市| 定西市| 镇雄县| 江陵县| 惠安县| 山东| 黄陵县| 遂溪县| 扬州市| 奈曼旗| 航空| 荆门市| 顺平县| 元阳县| 深圳市| 伊金霍洛旗| 资源县| 斗六市| 双桥区| 广昌县| 山东| 望谟县| 东宁县| 沐川县| 集贤县|

<em id="iiagq"><rt id="iiagq"></rt></em>

<legend id="iiagq"></legend>