99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

端側模型又“瘦身成功”!220倍極限提速、8B模型超過Gemma3-12B,面壁智能甩出“性能大小王”

0
分享至


智東西
作者 ZeR0
編輯 漠影

智東西6月7日報道,在2025智源大會期間,北京大模型創企面壁智能發布開源模型MiniCPM 4.0的兩個新版本(0.5B、8B),代號「前進四」。

MiniCPM4-0.5B訓練開銷僅為Qwen3-0.6B的2.7%,以一半參數量實現翻倍性能,綜合得分平均分為52.06分,遠超同類模型。面壁科技還發布了一個0.5B的三級量化版本,平均得分是56分,是非常好的成績。

MiniCPM4-8B訓練開銷僅22%,加了長下文稀疏化版本,做到同等參數、性能更強,綜合得分對標Qwen3-8B、超越Gemma3-12B,在下列同類端側模型排行榜中分數排名第一。


面壁智能CEO李大??偨Y說,MiniCPM4模型最大的特點就是快。

在端側跑140K上下文,需要很大的端側內存,屬于極端場景。在Jetson Orin AGX(64G)或RTX 4090(24G)硬件上運行128K長文本時,像Qwen3-8B這樣沒做過上下文稀疏化的模型,顯存不夠用,需要用CPU內存,offload導致速度急速下降;而MiniCPM4-8B做了快速稀疏化工作,可將占用的低長文本緩存降至1/4,在常規場景里至少可以取得3-5倍的速度優勢。


在顯存受限的極限場景中,MiniCPM4的測試數據甚至可以快到220倍。

面壁智能的MiniCPM4-MCP模型,在端側利用MCP協議,支持15個主流應用,取得了很高的綜合評測表現得分。另一個MiniCPM4-Survey端側版可在AI PC上構建Deep Research(深度研究)服務,是一個離線可用的隨身研究報告利器,有助于保護本地隱私數據。


面壁智能與英特爾緊密合作,首次端側解鎖128K長上下文窗口,在英特爾平臺上基于InfLLM 2.0稀疏注意力結構已實現3.8倍加速的推理優化效果。同時,MiniCPM4已經可以在華為昇騰、聯發科、高通等主流芯片上流暢運行,也支持vLLM、AutoGPT等推理框架,歐拉版正在積極適配中。


又快又好,是怎么做到的?

李大海分享了背后的技術細節——行業首個全開源系統級上下級稀疏化高效創新。


一、架構:混合稀疏注意力機制,稀疏與稠密方案靈活切換

傳統Transformer模型每token需和序列中所有token進行相關性計算逐字重復計算,效率低下。在稀疏注意力機制下,稀疏度越高,計算量越小,速度越快。

MiniCPM4采用了InfLLM 2.0混合稀疏注意力結構。該架構采用類似于檢索的思路,對文本分塊分區域處理,只對最具相關性重點區域進行注意力計算“抽查”,更加高效。通過這種方式,面壁智能可將稀疏度降到5%,將計算量降到10%。

同時,面壁智能還創新地采用了高效的自動雙頻換擋技術,長文本用稀疏方案,短文本用稠密方案。


二、 推理:自研全套端側高性能推理框架,90%瘦身 2倍速度提升

端側生態豐富,兼容是一件成本較高的事。面壁智能希望盡可能簡化端側模型部署的復雜度,自研了“三級火箭”推理框架。


(1)自研端側高性能推理框架CPM.cu:實現稀疏、投機和量化的高效結合,通過FR-Spec輕量化投機采樣,相比原始模型提速2倍,讓小模型給大模型當實習生,給小模型減負加速,速度提升超5倍。

(2)極致低位寬量化BitCPM:端側低內存容量部署友好,4bit量化達到業界SOTA等級,3倍量化,可瘦身90%。

(3)自研跨平臺部署框架Arkinfer:面向多平臺端側芯片極致優化,跨平臺高效投機采樣和限制解碼,支持端側多平臺Model Zoo的絲滑使用,速度提升2倍。

三、學習:多維度訓練策略優化,FP8低精度提升訓練速度

在高效訓練方面,面壁智能也做了很多探索。

(1)模型風洞Model Wind Tunnel v2:用小模型給大模型探路,通過高效訓練小模型,尋求大模型訓練最佳配置,將學習率、批大小等移至大模型訓練,完成最優配置搜索。

(2)Chunk-wise Rollout負載均衡強化學習:強化學習訓練中,單一數據過長時,將在GPU上產生大量空泡,導致負載不均,因此將長數據分段采樣,使其在下一階段繼續生成,以此實現GPU資源的高效分配。

(3)工程優化:采用FP8訓練,以低精度加速模型計算,提升訓練效率;采用MTP監督信號,提供更稠密的監督信號,提升模型數據利用率。

四、數據:用8T高質量數據訓練,表現不輸36T競品數據

MiniCPM4模型還有一個重要優勢:只用了非常少的高質量訓練語料。

好數據才能跑出好性能。8T的面壁高質量數據,與36T競品數據的模型訓練效果相當。

(1)Ultra-FineWeb:高效數據嚴格篩選機制,可構建萬億高質量數據集,通過“半成品加工法”高效驗證,先訓一個’半熟”模型,再用新數據快速微調,能夠將成本降低90%;用fastText工具進行大語言模型質檢,處理15萬億數據只需1000小時CPU。

(2)UltraChat-v2:高能力密度數據合成,可構建大規模知識密集型、推理密集型、指令遵循型、長文本處理型、工具調用型等多樣化的有監督微調數據。

結語:以更低成本實現更高智能,端側模型走向普及普惠

總體來看,MiniCPM4以更少參數量實現出色性能的背后,是面壁智能從架構層、系統層、推理層到數據層的層層優化。而用更少的數據和算力做出同等性能的模型,意味著降低成本,能將時間和資源用于做更多、更有價值的事。

作為國內端側模型代表,面壁智能旗下模型矩陣已覆蓋基座模型MiniCPM、旗艦多模態模型MiniCPM-V、旗艦全模態模型MiniCPM-o,全球下載量超千萬。

面壁智能計劃通過MiniCPM持續推進密度定律。李大海相信,接下來數年會涌現出越來越聰明的智能硬件和終端,搭載像MiniCPM這樣的端側模型,更好地為大眾服務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
46歲章子怡,一臉雀斑連眉毛都漂了,打臉多少偶像包袱明星

46歲章子怡,一臉雀斑連眉毛都漂了,打臉多少偶像包袱明星

陳述影視
2025-06-07 20:44:35
三亞這夜,宋茜胖了,佟麗婭裝嫩,王楚然白到發光,宋佳壓軸!

三亞這夜,宋茜胖了,佟麗婭裝嫩,王楚然白到發光,宋佳壓軸!

觀察鑒娛
2025-06-08 09:56:31
活久見!特朗普任命22歲畢業生領導美國反恐,美國輿論一片嘩然

活久見!特朗普任命22歲畢業生領導美國反恐,美國輿論一片嘩然

大道無形我有型
2025-06-07 21:10:34
華裔招手馬斯克,合作成立第三黨!打破200年的兩黨制有多難?

華裔招手馬斯克,合作成立第三黨!打破200年的兩黨制有多難?

昨夜軍帖
2025-06-08 09:03:23
“難怪小學女老師,十個有九個單身”,一段聊天記錄,揭露了真相

“難怪小學女老師,十個有九個單身”,一段聊天記錄,揭露了真相

妍妍教育日記
2025-06-03 20:00:38
男性最“耗陽”行為,煙酒未上榜,排第一的,多數人不重視!

男性最“耗陽”行為,煙酒未上榜,排第一的,多數人不重視!

深度知局
2025-05-20 17:47:03
特朗普威脅削減撥款?加州強硬表態:“我們可以暫停上繳聯邦稅”

特朗普威脅削減撥款?加州強硬表態:“我們可以暫停上繳聯邦稅”

財聯社
2025-06-08 04:27:08
“三天是男人的極限”,女孩謊稱提前開學去見男友,網友直接舉報

“三天是男人的極限”,女孩謊稱提前開學去見男友,網友直接舉報

妍妍教育日記
2025-02-09 22:58:40
日媒為國足鳴不平,表示國足遭針對,點球屬誤判,日網友則一邊倒

日媒為國足鳴不平,表示國足遭針對,點球屬誤判,日網友則一邊倒

體壇風之子
2025-06-08 04:30:03
1975年,曾憲植之子為勞改中的母親求情,毛主席批復:接回北京

1975年,曾憲植之子為勞改中的母親求情,毛主席批復:接回北京

紅夢史說
2025-06-05 08:45:02
朝鮮驅逐艦扶正后下水!軍需工業部長現場指揮

朝鮮驅逐艦扶正后下水!軍需工業部長現場指揮

IN朝鮮
2025-06-06 11:31:08
零跑汽車 CEO 朱江明:未來車企一輛中大型SUV賣 5 萬元是合理的

零跑汽車 CEO 朱江明:未來車企一輛中大型SUV賣 5 萬元是合理的

IT之家
2025-06-06 08:45:12
轟-20,中國體系作戰的最后一塊拼圖

轟-20,中國體系作戰的最后一塊拼圖

華山穹劍
2025-06-08 19:36:37
醫生坦言:男性若長期不喝酒,用不了多長時間,身體或有4個變化

醫生坦言:男性若長期不喝酒,用不了多長時間,身體或有4個變化

明月聊史
2025-06-07 16:12:23
四大血型排行榜公布:B型血平均年齡76歲,排名第二,第1是哪型?

四大血型排行榜公布:B型血平均年齡76歲,排名第二,第1是哪型?

39健康網
2025-04-14 19:46:37
江青罕見的9張彩色老照片:年輕時氣質出眾,大多數人沒見過圖1

江青罕見的9張彩色老照片:年輕時氣質出眾,大多數人沒見過圖1

詩意世界
2025-05-13 21:57:12
我想說個暴論:其實這次印度很想要復刻對越自衛反擊戰。

我想說個暴論:其實這次印度很想要復刻對越自衛反擊戰。

火山雜談
2025-05-15 00:05:44
這下可給加州州長樂壞了,咱也是見證歷史了!

這下可給加州州長樂壞了,咱也是見證歷史了!

火山雜談
2025-05-06 00:05:16
難以置信!汽車銷售給客戶備注“窮B”,關鍵還把截圖發給了客戶

難以置信!汽車銷售給客戶備注“窮B”,關鍵還把截圖發給了客戶

火山詩話
2025-06-08 11:55:15
國補停了?現在需要排隊等,未來可能會限額搶?

國補停了?現在需要排隊等,未來可能會限額搶?

中產先生
2025-06-08 22:57:13
2025-06-09 04:40:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
9975文章數 116771關注度
往期回顧 全部

數碼要聞

全新 AirTag 即將上市 擁有三項升級功能

頭條要聞

女子花5000多元找收納師后曬圖 網友:我以為是收納前

頭條要聞

女子花5000多元找收納師后曬圖 網友:我以為是收納前

體育要聞

冠軍高芙:只要專注自己 太陽就會照常升起

娛樂要聞

與前妻對簿公堂卻暴露了張紀中的窘境

財經要聞

暴漲超9%!白銀狂飆,“搶奪”黃金光環!

科技要聞

馬斯克"越紅線",美政府急尋SpaceX替代品

汽車要聞

復古造型樂趣依舊 寶馬R12 nineT又帥又好騎

態度原創

數碼
親子
教育
藝術
手機

數碼要聞

紅魔電競平板3Pro再預熱:行業首發5280Hz超高頻PWM調光

親子要聞

互相不認識也能一起跳一天,快樂就這么簡單

教育要聞

原來四級臨時抱佛腳就能過7天真夠了?。。?/h3>

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

WWDC將預覽蘋果全新“Liquid Glass”操作系統界面

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 同德县| 方正县| 晋城| 乐都县| 类乌齐县| 灵璧县| 阳谷县| 铜陵市| 油尖旺区| 云霄县| 扶绥县| 商都县| 砀山县| 陈巴尔虎旗| 沈阳市| 绩溪县| 孟津县| 钦州市| 平利县| 林口县| 泗阳县| 灌南县| 太仆寺旗| 怀集县| 封开县| 大田县| 天台县| 灌云县| 古浪县| 仲巴县| 娄烦县| 和静县| 个旧市| 仪陇县| 铅山县| 集安市| 纳雍县| 德庆县| 图片| 安宁市| 聊城市|