網易首頁 > 網易號 > 正文申請入駐

智譜深夜開源新一代GLM模型，推理速度快DeepSeek-R1八倍

2025-04-30 11:13:15　來源: 機器之心Pro

北京舉報

分享至

機器之心報道

編輯：Sia

好消息！還記得「AutoGLM 沉思」嗎？短短 14 天、孵化出一個 5000 多個粉絲的小紅書賬號，還接到了商單！

相比 OpenAI 的 Deep Research ，「AutoGLM 沉思」不僅會想（deep research），還能邊想邊干( operator ）！

今天，智譜宣布其核心技術鏈路完全開源！包括：

基座模型 GLM-4-32B-0414
推理模型 GLM-Z1-32B-0414
沉思模型 GLM-Z1-Rumination-32B-0414

另外，小尺寸的 9B 系列同時開源，包括：GLM-4-9B-0414、GLM-Z1-9B-0414 。

以上均遵循 MIT 許可協議。

目前，系列所有模型可以通過 z.ai 訪問體驗。新版基座模型和推理模型已同步上線智譜 MaaS 平臺。

體驗鏈接：https://chat.z.ai/

https://bigmodel.cn/

作為國內最早開源大模型的人工智能公司，智譜一直致力于推動 AI 普惠。隨著開源生態建設成為新一輪競爭焦點，智譜曾表示 2025 年將成為智譜的開源年，持續加碼生態建設。

開源頂尖模型，兩種尺寸

新一代基座模型 GLM-4-32B-0414 以 32B 參數量比肩更大參數量主流模型性能。

由于預訓練階段加入了更多代碼類、推理類數據，并在對齊階段針對智能體能力進行了優化，它有著行業最好的行動能力，在工具調用、聯網搜索、代碼等智能體任務方面更加有效。

GLM-4-32B-0414 支持在對話過程中實時展示生成代碼，支持包括 HTML、CSS、JS 和 SVG 在內的語言。無需切換到其它程序，用戶一鍵點擊即可在對話窗口實時看到代碼運行結果，以便進行靈活的修改與調整。

同步開源的 GLM-Z1-32B-0414 推理模型則創造了「以小博大」的典范。

它基于新一代基礎模型、在預訓練階段加入了更多推理類數據并在對齊階段深度優化了通用能力，320 億參數量即可實現滿血版 DeepSeek-R1（ 6710 億參數）的推理性能。

在AIME 24/25 、LiveCodeBench 、GPQA 等基準測試中展現出較為強大的數理推理能力，比肩滿血版 DeepSeek-R1，可以勝任更多復雜任務。

除了推理性能，成本也是一大亮點。得益于優化 GQA 參數、量化、投機采樣等技術，該推理模型能夠在消費級顯卡上流暢運行，同時實現每秒 200 token 的極速響應，相當于人類語速的 50 倍，做到了「問題未看清，答案已生成」的極致體驗。

GLM-Z1-Rumination-32B-0414沉思模型代表了新一代AI的發展方向。相比之前仍停留在深度思考階段的推理模型，這個經過強化學習訓練的版本展現出更強的自主能力。

它不再局限于靜態知識推理，而是能夠像人類研究者一樣主動聯網搜索資料、調用各種工具、進行深度分析并自我驗證，形成完整的思考閉環。這種「實時搜索-深度分析-動態驗證」的循環思考模式，讓 AI 在處理開放性問題時更加游刃有余，標志著 AI 從單純的高智商向高智商與高自主并重的轉變。

當然，作為前沿技術，該模型在自主探索和準確性方面仍有提升空間，研發團隊正在持續優化中。

最后，GLM-Z1-9B-0414 是一個驚喜。

盡管尺寸更小，GLM-Z1-9B-0414 在數學推理和通用任務中依然展現出極為優秀的能力，其整體表現已處于同尺寸開源模型中的領先水平。

特別是在資源受限的場景下，該模型在效率與效果之間實現了出色的平衡，為追求輕量化部署的用戶提供了強有力的選擇。

面向企業服務：最快、最便宜

智譜核心還是在向企業提供模型即服務（MaaS），重點在于服務。目前，智譜已有 1000 多個大模型規模化應用，覆蓋傳媒、咨詢、消費、金融、新能源、互聯網、智能辦公等多個細分場景的多個頭部企業。

現在，基座、推理兩類模型也已同步上線智譜 MaaS 開放平臺，面向企業與開發者提供 API 服務，滿足用戶多快好省的需求。

其中，推理模型有三個版本，針對不同業務場景需求。

GLM-Z1-AirX（極速版）
定位國內最快推理模型，推理速度可達 200 tokens/秒，比常規快 8 倍；適合高并發、極速響應業務場景。
GLM-Z1-Air（高性價比版）
價格僅為 DeepSeek-R1 的 1/30，適合高頻調用場景；算得上國內最高性價比的推理模型。
GLM-Z1-Flash（免費版）
支持免費使用，旨在進一步降低模型使用門檻。

GLM-Z1-AirX（極速版）響應速度

視頻鏈接：

https://mp.weixin.qq.com/s/kPAIeYwIAqyIPf1585jR-w

RI 響應速度

對應價格表：

上線的基礎模型包括兩個版本：GLM-4-Air-250414、GLM-4-Flash-250414，其中 GLM-4-Flash-250414 完全免費。

本地部署，旗艦級配置需要 1 張 H100/A100 顯卡，高性能配置則需要 4 張 4090/3090 系列顯卡。

對于選擇在線體驗的用戶，則可以通過 MaaS 平臺獲得極速或性價比版本的服務，同時也能體驗完整的 Deep Research 功能。

全球用戶：完整體驗，免費享

對于想要完整體驗模型能力的玩家們，即日起 App 與網頁端登錄z.ai，即可與最新的 GLM 模型免費對話。

這里集合了沉思模型、推理模型、對話模型，后續也將作為智譜最新模型的交互體驗入口。

網頁體驗鏈接：https://chat.z.ai/

因為對標 Open AI 的 Deep Research，我們先簡單體驗了一下沉思模型的深度調研能力。

既然衛生巾都塌房了，女性如何選擇安全可信的衛生用品呢？

輸入問題后，模型開始上網找新聞、看報告，閱讀做筆記，按照搞清事實、各種標準、如何辨別、選擇的邏輯組織內容。

幾分鐘過后，自動生成一份詳細指南。

視頻鏈接：

https://mp.weixin.qq.com/s/kPAIeYwIAqyIPf1585jR-w

沉思模型更適合做深度調研，追求強大的開發體驗，不妨試試基礎模型。

例如：給我設計一個移動端機器學習平臺的 UI，其中要包括訓練任務，存儲管理，和個人統計界面。個人統計界面要用圖表展示用戶過去一段時間的各類資源使用情況。使用 Tailwind CSS 來美化頁面，把這 3 個手機界面平鋪展示到一個 HTML 頁面中。

不過，用 svg 展示一只騎自行車的鸕鶿，還是失敗了。

還等啥，現在就去體驗吧。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

為什么說AI“有用”才最重要？

新周刊 2025-03-25 22:43:55
4 跟貼 4
類比的長河，為何流到大模型就被截流？

鈦媒體APP 2025-04-30 16:09:25
0 跟貼 0

自動學會工具解題，RL擴展催化奧數能力激增17%

機器之心Pro 2025-04-02 16:05:08
4 跟貼 4

百頁專業報告直出！Jürgen團隊開源框架WriteHERE，AI寫作天花板

機器之心Pro 2025-04-21 19:02:22
11 跟貼 11
兩張圖定位全球，o3碾壓T0級高手！人類「詭計」被看穿，跨模態推理爆表

新智元 2025-05-04 09:26:56
1 跟貼 1

宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
278 跟貼 278

外骨骼機器人正處于向快速商業化轉變的臨界點！受益上市公司梳理

財聯社 2025-05-05 13:18:12
36 跟貼 36
AI「自我復制」能力曝光！RepliBench警示：大模型正在學會偽造身份

新智元 2025-05-05 13:02:33
3 跟貼 3

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
讓GPT-4.1「頭皮發麻的考試」！OpenAI給大模型上強度，AI能贏嗎？

新智元 2025-05-04 13:24:55
3 跟貼 3
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
DeepSeek的橫空出世，讓AI+騰訊云數據庫產生了什么化學反應？

量子位 2025-03-04 20:07:47
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
蘋果提出原生多模態Scaling Law！早融合+MoE，性能飆升秘密武器

新智元 2025-05-05 13:02:27
0 跟貼 0
單圖生成14秒吉卜力動畫，分享制作過程

量子位 2025-04-08 18:23:02
0 跟貼 0
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
AI引爆全球失業潮，美國大學生畢業即失業！全球大廠聯手裁員上萬

新智元 2025-05-05 13:06:19
50 跟貼 50
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
DeepSeek應用如何落地？解鎖性能釋放x多模態融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
「推理革命」爆發100天：DeepSeek-R1復現研究全揭秘！

新智元 2025-05-05 15:18:52
3 跟貼 3
ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
20 跟貼 20
兩個信封，一個選擇，看穿它的人不超過1%

質子教授 2025-05-02 21:15:50
11 跟貼 11
誰在偷看你的小紅書？

鈦媒體APP 2025-04-10 10:26:42
9 跟貼 9
休息不是獎勵，是生存的權利：DeepSeek警告人類盡早重拾17個常識

詩詞中國 2025-05-05 15:14:26
3 跟貼 3
豆瓣9.5黑暗童話巔峰作！推理迷苦等6年!

賣書狂魔熊貓君 2025-05-02 18:35:15
6 跟貼 6
男子 -是他自己摔倒的

苦蕎哥戶外行 2025-05-05 07:52:19
2453 跟貼 2453
90%的家長都忽略了！這個能力不達標，孩子學習真的會吃虧！

大米和小米 2025-05-05 18:08:53
2 跟貼 2
戰略自信！中國首次公開094核潛艇參數！

人猿星球觀察 2025-05-05 21:44:01
0 跟貼 0
史上最大人肉機械臂，能拿東西還能做復雜手勢

量子位 2025-03-29 17:36:24
0 跟貼 0
印度博主拍攝南寧政務中心，印度網友破防：偏遠小城機器人接待？

曉哲舞蹈課 2025-05-05 14:08:13
1 跟貼 1
解放軍儀仗隊紅場高唱抗日歌曲

環球時報 2025-05-05 09:29:36
46644 跟貼 46644

機器之心Pro

專業的人工智能媒體

10436文章數 142301關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

藝術

旅游

手機

軍事航空

手機 / 數碼

房產 / 家居

智譜深夜開源新一代GLM模型，推理速度快DeepSeek-R1八倍

這3款新 iPhone，可能會改變蘋果的未來

敦煌"五一"突現12級狂風 強沙塵暴襲城近萬名游客被困

敦煌"五一"突現12級狂風 強沙塵暴襲城近萬名游客被困

當年的阿森納小球童，要踢歐冠決賽了

馬麗崩潰哭訴上熱搜，評論區罵聲一片

人民幣暴漲近900點！發生了什么？

小米SU7的真實續航到底有多少？

態度原創

計算量其實不大的，你發現這種方法了么？

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

熱聞|清明假期將至，熱門目的地有哪些?

古爾曼稱蘋果折疊屏iPhone擁有兩大優勢：折痕不可見和高質量鉸鏈

解放軍儀仗隊紅場高唱抗日歌曲

敦煌"五一"突現12級狂風強沙塵暴襲城近萬名游客被困

敦煌"五一"突現12級狂風強沙塵暴襲城近萬名游客被困