99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

野生DeepSeek火了,速度碾壓官方版,權重開源

0
分享至



機器之心報道

編輯:杜偉、澤南

沒等來 DeepSeek 官方的 R2,卻迎來了一個速度更快、性能不弱于 R1 的「野生」變體!

這兩天,一個名為「DeepSeek R1T2」的模型火了!



這個模型的速度比 R1-0528 快 200%,比 R1 快 20%。除了速度上的顯著優勢,它在 GPQA Diamond(專家級推理能力問答基準)和 AIME 24(數學推理基準)上的表現均優于 R1,但未達到 R1-0528 的水平。

在技術層面,采用了專家組合(Assembly of Experts,AoE)技術開發,并融合了 DeepSeek 官方的 V3、R1 和 R1-0528 三大模型。

當然,這個模型也是開源的,遵循 MIT 協議,并在 Hugging Face 上開放了權重。



Hugging Face 地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera

經過進一步了解,我們發現:DeepSeek R1T2 是德國一家 AI 咨詢公司「TNG」推出的,模型全稱為「DeepSeek-TNG R1T2 Chimera」(以下簡稱 R1T2)。

該模型除了前文提到的在智力水平和輸出效率之間實現完美平衡之外,相較于這家公司的初代模型「R1T Chimera」,智力大幅躍升,并實現了突破性的 think-token 一致性。

不僅如此,即使在沒有任何系統提示的情況下,該模型也能表現穩定,提供自然的對話交互體驗。



在評論區,有人誤以為這個模型出自 DeepSeek 官方,并且認為他們是不是也在走相同的路線:給模型起各種名稱,就是不用主系列下一代版本號?



更多的人認可該模型「找到了智能與輸出 token 長度之間的最佳平衡點,并且提升了速度」,并對該模型在現實世界的表現充滿了期待。





模型細節概覽

從 Hugging Face 主頁來看,R1T2 是一個基于 DeepSeek R1-0528、R1 以及 V3-0324 模型構建的 AoE Chimera 模型。

該模型是一個采用 DeepSeek-MoE Transformer 架構的大語言模型,參數規模為 671B。

R1T2 是該公司 4 月 26 日發布的初代模型「R1T Chimera」的首個迭代版本。相較于利用雙基模型(V3-0324 + R1)的初代架構,本次升級到了三心智(Tri-Mind)融合架構,新增基模型 R1-0528。

該模型采用 AoE 技術構建,過程中利用較高精度的直接腦區編輯(direct brain edits)實現。這種精密融合不僅帶來全方位提升,更徹底解決了初代 R1T 的

token 一致性缺陷。



團隊表示,R1T2 對比其他模型具備如下優劣:

  • 與 DeepSeek R1 對比:R1T2 有望成為 R1 的理想替代品,兩者幾乎可以通用,并且 R1T2 性能更佳,可直接替換。
  • 與 R1-0528 對比:如果不需要達到 0528 級別的最高智能,R1T2 相比之下更加經濟。
  • 與 R1T 對比:通常更建議使用 R1T2,除非 R1T 的特定人格是最佳選擇、思考 token 問題不重要,或者極度需求速度。
  • 與 DeepSeek V3-0324 對比:V3 速度更快,如果不太關注智能可以選擇 V3;但是,如果需要推理能力,R1T2 是首選。

此外,R1T2 的幾點局限性表現在:

  • R1-0528 雖推理耗時更長,但在高難度基準測試中仍優于 R1T2;
  • 經 SpeechMap.ai(由 xlr8harder 提供)測評,R1T2 應答克制度(reserved)顯著高于 R1T,但低于 R1-0528;
  • 暫不支持函數調用:受 R1 基模型影響,現階段不推薦函數調用密集型場景(后續版本可能修復);
  • 基準測試變更說明:開發版由 AIME24+MT-Bench 變更為 AIME24/25+GPQA-Diamond 測評體系,新體系下 R1 與初代 R1T 的分差較早期公布數據更大。

最后,關于 R1T2 中重要的 AoE 技術,可以參考以下論文。



  • 論文標題:Assembly of Experts: Linear-time construction of the Chimera LLM variants with emergent and adaptable behaviors
  • 論文地址:https://arxiv.org/pdf/2506.14794

參考鏈接:https://x.com/tngtech/status/1940531045432283412

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1953年梁漱溟怒懟毛主席:工人九天之上,農民九地之下!

1953年梁漱溟怒懟毛主席:工人九天之上,農民九地之下!

瑾瑜聊情感
2025-07-02 17:43:04
伊朗真的要造核武器了?

伊朗真的要造核武器了?

中國新聞周刊
2025-07-04 22:30:09
以軍稱已控制加沙地帶65%以上地區

以軍稱已控制加沙地帶65%以上地區

界面新聞
2025-07-04 23:57:11
特斯拉Model Y痛失全球銷冠,一款中國車殺入全球銷量前十

特斯拉Model Y痛失全球銷冠,一款中國車殺入全球銷量前十

金融界
2025-07-04 10:39:21
創造歷史!7方交易達成在即,湖人再現離譜操作,太陽欲效仿雄鹿

創造歷史!7方交易達成在即,湖人再現離譜操作,太陽欲效仿雄鹿

籃球圈里的那些事
2025-07-04 12:12:44
比稀有坐騎還罕見!《魔獸》玩家5年只做一件事:囤魚1000萬條!

比稀有坐騎還罕見!《魔獸》玩家5年只做一件事:囤魚1000萬條!

魔獸世界研究所
2025-06-28 22:43:33
安徽省政府發布重要決定

安徽省政府發布重要決定

北青網-北京青年報
2025-07-04 19:40:12
走路踩狗屎!7月翻身發大財的生肖,貴人財運頻頻來

走路踩狗屎!7月翻身發大財的生肖,貴人財運頻頻來

毅談生肖
2025-07-03 11:40:43
揮淚斬馬謖!皇馬正式9000萬出售“效率王”!欽點簽約6000萬射手

揮淚斬馬謖!皇馬正式9000萬出售“效率王”!欽點簽約6000萬射手

頭狼追球
2025-07-04 11:03:51
泡泡瑪特回應6300萬英鎊英國買樓

泡泡瑪特回應6300萬英鎊英國買樓

第一財經資訊
2025-07-03 18:15:09
87年女友考上清華跟我分手,我當兵立功升職,在慶功宴上再次相遇

87年女友考上清華跟我分手,我當兵立功升職,在慶功宴上再次相遇

凱裕說故事
2025-07-01 17:12:18
拯救性癮者:她說就算被傳到色情網站上也無所謂|我會拯救你21

拯救性癮者:她說就算被傳到色情網站上也無所謂|我會拯救你21

天才捕手計劃
2025-07-03 21:21:52
提高警惕!今年最大范圍高溫將來,臺風丹娜絲基本鎖定我國

提高警惕!今年最大范圍高溫將來,臺風丹娜絲基本鎖定我國

中國氣象愛好者
2025-07-04 23:53:23
海南一企業22年前競得地塊被判合同無效:未完成征收等手續,原告已上訴

海南一企業22年前競得地塊被判合同無效:未完成征收等手續,原告已上訴

澎湃新聞
2025-07-04 20:26:39
麥迪:很多人30歲才開始突破瓶頸&拿冠軍 但我30歲就已經廢了

麥迪:很多人30歲才開始突破瓶頸&拿冠軍 但我30歲就已經廢了

直播吧
2025-07-04 20:49:54
楊丞琳李榮浩:還相愛,但只能分開。

楊丞琳李榮浩:還相愛,但只能分開。

美芽
2025-07-02 19:14:45
哈馬斯遭圍攻,即將被繳械,伊朗又慫了......

哈馬斯遭圍攻,即將被繳械,伊朗又慫了......

山河路口
2025-07-04 23:25:53
航拍現場:南京隊,今晚奧體中心首練!跑道上正安裝線陣音響!65769紀錄有望被動搖?網友:你敢賣,我就敢來

航拍現場:南京隊,今晚奧體中心首練!跑道上正安裝線陣音響!65769紀錄有望被動搖?網友:你敢賣,我就敢來

揚子晚報
2025-07-03 21:41:45
小小試劑盒,青春報國心

小小試劑盒,青春報國心

微言教育
2025-07-04 17:13:59
5800萬付得起但無法注冊!羅馬諾:尼科轉會巴薩因注冊問題告吹!

5800萬付得起但無法注冊!羅馬諾:尼科轉會巴薩因注冊問題告吹!

直播吧
2025-07-04 17:04:04
2025-07-05 02:39:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10788文章數 142353關注度
往期回顧 全部

科技要聞

被雷軍"震驚"后,何小鵬"藏起"G7的戰報

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

體育要聞

體壇最爽打工人:37歲被裁,工資領到72歲

娛樂要聞

李宇春身上的標簽哪個才是真的?

財經要聞

茅臺從3300跌到1700 泡沫破了酒才真香

汽車要聞

重生之拿回銷量 領克10 EM-P搶鮮實拍

態度原創

房產
健康
家居
手機
軍事航空

房產要聞

重磅發布!海南樓市2025上半年Top10榜單出爐!

呼吸科專家破解呼吸道九大謠言!

家居要聞

合理布局 三口之家的溫馨空間

手機要聞

realme 真我 15 系列手機入網

軍事要聞

哈馬斯處決12人 罪名包括與以軍方合作

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 湟源县| 鲁甸县| 隆安县| 临桂县| 江源县| 灵武市| 涿鹿县| 太湖县| 都江堰市| 离岛区| 精河县| 衡水市| 大宁县| 呼伦贝尔市| 张家界市| 临桂县| 磐石市| 阿坝| 通道| 若尔盖县| 仪陇县| 荥阳市| 江都市| 枣强县| 泸定县| 河南省| 裕民县| 奉节县| 余姚市| 垣曲县| 保山市| 桓台县| 屏边| 兴安县| 满洲里市| 大同县| 忻城县| 舒城县| 南郑县| 镇江市| 惠来县|