99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,智譜一口氣免費開源6款模型,200 tokens/秒成商用速度之最

0
分享至

金磊 發自 凹非寺
量子位 | 公眾號 QbitAI

就在剛剛,智譜一口氣上線并開源了三大類最新的GLM模型:

  • 沉思模型GLM-Z1-Rumination
  • 推理模型GLM-Z1-Air
  • 基座模型GLM-4-Air-0414

若是以模型大小(9B和32B)來劃分,更是可以細分為六款



首先是兩個9B大小的模型:

  • GLM-4-9B-0414:主攻對話,序列長度介于32K到128K之間
  • GLM-Z1-9B-0414:主攻推理,序列長度介于32K到128K之間

還有四個32B大小的模型,它們分別是:

  • GLM-4-32B-Base-0414:基座模型,序列長度介于32K到128K之間
  • GLM-4-32B-0414:主攻對話,序列長度介于32K到128K之間
  • GLM-Z1-32B-0414:主攻推理,序列長度介于32K到128K之間
  • GLM-Z1-32B-Rumination-0414:主攻推理,序列長度為128K

而隨著一系列模型的開源,智譜也解鎖了一項行業之最——

推理模型GLM-Z1-32B-0414做到了性能與DeepSeek-R1等頂尖模型相媲美的同時,實測推理速度可達200 tokens/秒

如此速度,已然是目前國內商業模型中速度最快,而且它的高性價比版本價格也僅為DeepSeek-R1的1/30

值得一提的是,本次開源的所有模型均采用寬松的MIT許可協議。

這就意味著上述的所有模型都可以免費用于商業用途、自由分發,為開發者提供了極大的使用和開發自由度。

那么這些開源模型的效果又如何?

(PS:文末有彩蛋~)

先看性能

首先來看下GLM-4-32B-0414

它是一款擁有320億參數的基座大模型,其性能足以比肩國內外規模更大的主流模型。

據了解,這個模型基于15T高質量數據進行預訓練,其中特別融入了大量推理類合成數據,為后續強化學習擴展提供了堅實基礎。

在后訓練階段,智譜團隊不僅完成了對話場景的人類偏好對齊,還運用拒絕采樣和強化學習等先進技術,重點提升了模型在指令理解、工程代碼生成、函數調用等關鍵任務上的能力,從而顯著增強了智能體執行任務的核心素質。

實際測試表明,GLM-4-32B-0414在工程代碼編寫、Artifacts生成、函數調用、搜索問答及報告撰寫等多個應用場景均展現出色表現。

部分基準測試指標已達到或超越 GPT-4o、DeepSeek-V3-0324(671B)等更大規模模型的水平。



從實測效果來看,GLM-4-32B-0414進一步提升了代碼生成能力,可處理并生成結構更復雜的單文件代碼。

例如來上這么一段Prompt:

  • 用HTML模擬太陽系的行星運動。



再如:

  • 設計一個支持自定義函數繪制的繪圖板,可以添加和刪除自定義函數,并為函數指定顏色。



以及設計一個小游戲也是不在話下:

  • 用HTML網頁實現2048小游戲。



再來看下GLM-Z1-32B-0414的性能,一款專為深度推理優化的模型。

這個模型在GLM-4-32B-0414的基礎上,采用了冷啟動結合擴展強化學習的策略,并針對數學推導、代碼生成、邏輯推理等高難度任務進行了專項優化,顯著提升了復雜問題的解決能力。

此外,它還通過引入基于對戰排序反饋的通用強化學習(RLHF),模型的泛化能力得到進一步強化。

盡管僅擁有32B參數,GLM-Z1-32B-0414在部分任務上的表現已可媲美 671B 參數的DeepSeek-R1。

在AIME 24/25、LiveCodeBench、GPQA等權威基準測試中,該模型展現出卓越的數理推理能力,能夠高效應對更廣泛、更具挑戰性的復雜任務。



接下來,是更小規模的GLM-Z1-9B-0414,在技術上是沿用了上述模型的方法。

雖然只有9B大小,但它在數學推理及通用任務上展現出超越參數規模的卓越性能,綜合表現穩居同量級開源模型前列。

尤其值得關注的是,在資源受限的應用場景中,該模型能夠高效平衡計算效率與推理質量,為輕量化AI部署提供了極具競爭力的解決方案。



最后,再來看下沉思模型GLM-Z1-Rumination-32B-0414

這個模型可以說是智譜對AGI未來形態的一個探索。

沉思模型采用與傳統推理模型截然不同的工作范式,通過多步深度思考機制有效應對高度開放性和復雜性問題。

其核心突破體現在三個方面:

  1. 在深度推理過程中智能調用搜索工具處理復雜子任務;
  2. 創新性地引入多維度規則獎勵體系,實現端到端強化學習的精準引導與擴展;
  3. 完整支持”問題發現→信息檢索→邏輯分析→任務解決”的研究閉環系統。

這些技術創新使該模型在學術寫作、深度研究等需要復雜認知能力的任務上展現出顯著優勢。

例如讓它回答一個科學假設推演問題:

  • 如果人類在火星地下發現液態湖泊中存在類似地球古菌的微生物,請推測:
    (1) 這些微生物可能如何適應極端環境?(2) 這一發現對‘生命起源泛種論’的支持/反駁證據有哪些?(3) 設計一個可驗證這些假說的空間實驗方案(預算限制5億美元)。
再看價格

除模型開源外,基座、推理兩類模型也已同步上線智譜MaaS開放平臺(bigmodel.cn),面向企業與開發者提供API服務。

本次上線的基座模型提供兩個版本:GLM-4-Air-250414和GLM-4-Flash-250414,其中GLM-4-Flash-250414完全免費。

上線的推理模型分為三個版本,分別滿足不同場景需求:

  • GLM-Z1-AirX(極速版):定位國內最快推理模型,推理速度可達 200 tokens/秒,比常規快 8 倍;
  • GLM-Z1-Air(高性價比版):價格僅為 DeepSeek-R1 的 1/30,適合高頻調用場景;
  • GLM-Z1-Flash(免費版):支持免費使用,旨在進一步降低模型使用門檻。



為了更加一目了然,價格表如下:



至于配置方面,32B基礎模型、32B推理模型、32B沉思模型(裸模型)的要求如下:

  • 1張H100 / A100或者更先進的NVIDIA旗艦顯卡
  • 4張4090/5090/3090
One More Thing

除了上述內容之外,智譜這次還有一個亮點的動作——

拿下一個頂級域名Z.ai!



目前已經上線了下面三款模型:



而且官方還亮出了一個比較有意思的slogan:



最后,縱觀智譜在大模型時代的發展,不得不感慨其更新迭代以及開源的速度。

這樣難怪它能成為第一家正式啟動IPO流程的“大模型六小龍”。

體驗地址:
z.ai

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈佛研究發現:3種顏色是“抑郁色”,若孩子喜歡,家長需謹慎

哈佛研究發現:3種顏色是“抑郁色”,若孩子喜歡,家長需謹慎

禾禾媽愛學習
2025-04-22 15:27:09
下場爆發?火箭贏球海報:狄龍怒吼瞬間登上封面

下場爆發?火箭贏球海報:狄龍怒吼瞬間登上封面

直播吧
2025-05-03 12:17:15
“讓異性上癮的關系,從來不是真心。”

“讓異性上癮的關系,從來不是真心。”

程一
2025-03-30 21:35:44
竟然倒閉了?中國最“暴利”的行業,囂張20年后卻徹底被時代淘汰

竟然倒閉了?中國最“暴利”的行業,囂張20年后卻徹底被時代淘汰

森羅萬象視頻
2025-01-16 17:55:20
太夸張!今年五一武功山估計去了幾億人了,人山人海原來是這樣…

太夸張!今年五一武功山估計去了幾億人了,人山人海原來是這樣…

火山詩話
2025-05-02 18:11:35
出道11年,拍了好多戲,連劉亦菲都帶不動,如今搭檔孫儷終于火了

出道11年,拍了好多戲,連劉亦菲都帶不動,如今搭檔孫儷終于火了

新語愛八卦
2025-04-20 18:43:16
【2025.5.3】劉亦菲陳曉在一起?丞磊生日會?Z薇女兒?能講講朱正廷?《哪吒2》透支票房?

【2025.5.3】劉亦菲陳曉在一起?丞磊生日會?Z薇女兒?能講講朱正廷?《哪吒2》透支票房?

娛樂真爆姐
2025-05-03 22:39:50
網友:榮昌火了!現在全網最“冤”的男人就是他!

網友:榮昌火了!現在全網最“冤”的男人就是他!

丫頭舫
2025-05-03 14:31:23
“海康威視”即將展翅高飛?

“海康威視”即將展翅高飛?

木禾投研
2025-05-03 21:29:07
大批美國游客涌入中國,打著采購的幌子,真實目的竟讓美國難堪?

大批美國游客涌入中國,打著采購的幌子,真實目的竟讓美國難堪?

小噎論事
2025-04-19 09:18:10
油價一夜突變!今天5月3日調整后,全國加油站92、95汽油最新售價

油價一夜突變!今天5月3日調整后,全國加油站92、95汽油最新售價

藍色海邊
2025-05-03 06:22:44
37歲女子二婚6年又離婚,凈身出戶,崩潰感慨:現在男人都不傻

37歲女子二婚6年又離婚,凈身出戶,崩潰感慨:現在男人都不傻

農村情感故事
2025-04-29 12:22:15
最難的一道坎!中超5霸:誰先跨過去,就是冠軍

最難的一道坎!中超5霸:誰先跨過去,就是冠軍

話體壇
2025-05-03 22:56:19
2025年養老金大調整:企業退休人員漲6%,事業單位只漲3%!

2025年養老金大調整:企業退休人員漲6%,事業單位只漲3%!

詩詞中國
2025-05-03 15:21:43
為了升職我做了上司的情人,在酒店里我們交換了彼此

為了升職我做了上司的情人,在酒店里我們交換了彼此

深夜解密局
2025-05-03 23:25:32
節目效果拉滿!主裁判受傷無法堅持,瓦爾迪蹲下吹哨暫停比賽

節目效果拉滿!主裁判受傷無法堅持,瓦爾迪蹲下吹哨暫停比賽

懂球帝
2025-05-03 23:38:35
5 月,對中美兩國,異常關鍵

5 月,對中美兩國,異常關鍵

葉檀財經
2025-05-03 19:36:06
我娶了36歲大齡剩女,新婚當晚我后悔了,她剩下是有原因的

我娶了36歲大齡剩女,新婚當晚我后悔了,她剩下是有原因的

青青會講故事
2025-04-28 12:38:06
她曾被稱為“第一車模”,不雅視頻被男友傳上網,現在怎么樣了?

她曾被稱為“第一車模”,不雅視頻被男友傳上網,現在怎么樣了?

阿胡
2025-04-23 16:30:24
跟媽媽睡和不跟媽媽睡的孩子,長大后有啥區別

跟媽媽睡和不跟媽媽睡的孩子,長大后有啥區別

浩源的媽媽
2025-05-02 05:20:06
2025-05-04 00:28:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10422文章數 176129關注度
往期回顧 全部

科技要聞

特朗普下手,英偉達對華“特供版”要改

頭條要聞

加州州長:我們不是美國 向中國伸出開放之手

頭條要聞

加州州長:我們不是美國 向中國伸出開放之手

體育要聞

北京請神馬布里?許利民真有“玄學”!

娛樂要聞

金秀賢遭多家品牌起訴 索賠近60億韓元

財經要聞

全程直擊!2025巴菲特股東大會

汽車要聞

易三方科技體驗日·北京站上演硬核駕控

態度原創

教育
藝術
親子
時尚
健康

教育要聞

人因豐富而可愛,不要用一套標準去要求所有孩子

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

五一出行要牢記~

這4條裙子太火了,今年流行的風格都離不開它

唇皰疹和口腔潰瘍是"同伙"嗎?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 常山县| 道真| 固镇县| 东乌| 宣恩县| 肃北| 南通市| 台中市| 太仓市| 铜陵市| 武城县| 叙永县| 六安市| 山东省| 石河子市| 江源县| 分宜县| 齐河县| 辽阳县| 平和县| 绍兴县| 长丰县| 湟源县| 合作市| 乌什县| 阳西县| 贵港市| 临湘市| 广丰县| 涿鹿县| 阿克苏市| 湘阴县| 剑阁县| 阿城市| 鄂托克旗| 松桃| 石城县| 格尔木市| 嘉峪关市| 云霄县| 邢台县|