99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

野生DeepSeek火了,速度碾壓官方版,權(quán)重開源

0
分享至



機(jī)器之心報(bào)道

編輯:杜偉、澤南

沒等來(lái) DeepSeek 官方的 R2,卻迎來(lái)了一個(gè)速度更快、性能不弱于 R1 的「野生」變體!

這兩天,一個(gè)名為「DeepSeek R1T2」的模型火了!



這個(gè)模型的速度比 R1-0528 快 200%,比 R1 快 20%。除了速度上的顯著優(yōu)勢(shì),它在 GPQA Diamond(專家級(jí)推理能力問答基準(zhǔn))和 AIME 24(數(shù)學(xué)推理基準(zhǔn))上的表現(xiàn)均優(yōu)于 R1,但未達(dá)到 R1-0528 的水平。

在技術(shù)層面,采用了專家組合(Assembly of Experts,AoE)技術(shù)開發(fā),并融合了 DeepSeek 官方的 V3、R1 和 R1-0528 三大模型。

當(dāng)然,這個(gè)模型也是開源的,遵循 MIT 協(xié)議,并在 Hugging Face 上開放了權(quán)重。



Hugging Face 地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera

經(jīng)過進(jìn)一步了解,我們發(fā)現(xiàn):DeepSeek R1T2 是德國(guó)一家 AI 咨詢公司「TNG」推出的,模型全稱為「DeepSeek-TNG R1T2 Chimera」(以下簡(jiǎn)稱 R1T2)。

該模型除了前文提到的在智力水平和輸出效率之間實(shí)現(xiàn)完美平衡之外,相較于這家公司的初代模型「R1T Chimera」,智力大幅躍升,并實(shí)現(xiàn)了突破性的 think-token 一致性。

不僅如此,即使在沒有任何系統(tǒng)提示的情況下,該模型也能表現(xiàn)穩(wěn)定,提供自然的對(duì)話交互體驗(yàn)。



在評(píng)論區(qū),有人誤以為這個(gè)模型出自 DeepSeek 官方,并且認(rèn)為他們是不是也在走相同的路線:給模型起各種名稱,就是不用主系列下一代版本號(hào)?



更多的人認(rèn)可該模型「找到了智能與輸出 token 長(zhǎng)度之間的最佳平衡點(diǎn),并且提升了速度」,并對(duì)該模型在現(xiàn)實(shí)世界的表現(xiàn)充滿了期待。





模型細(xì)節(jié)概覽

從 Hugging Face 主頁(yè)來(lái)看,R1T2 是一個(gè)基于 DeepSeek R1-0528、R1 以及 V3-0324 模型構(gòu)建的 AoE Chimera 模型。

該模型是一個(gè)采用 DeepSeek-MoE Transformer 架構(gòu)的大語(yǔ)言模型,參數(shù)規(guī)模為 671B。

R1T2 是該公司 4 月 26 日發(fā)布的初代模型「R1T Chimera」的首個(gè)迭代版本。相較于利用雙基模型(V3-0324 + R1)的初代架構(gòu),本次升級(jí)到了三心智(Tri-Mind)融合架構(gòu),新增基模型 R1-0528。

該模型采用 AoE 技術(shù)構(gòu)建,過程中利用較高精度的直接腦區(qū)編輯(direct brain edits)實(shí)現(xiàn)。這種精密融合不僅帶來(lái)全方位提升,更徹底解決了初代 R1T 的

token 一致性缺陷。



團(tuán)隊(duì)表示,R1T2 對(duì)比其他模型具備如下優(yōu)劣:

  • 與 DeepSeek R1 對(duì)比:R1T2 有望成為 R1 的理想替代品,兩者幾乎可以通用,并且 R1T2 性能更佳,可直接替換。
  • 與 R1-0528 對(duì)比:如果不需要達(dá)到 0528 級(jí)別的最高智能,R1T2 相比之下更加經(jīng)濟(jì)。
  • 與 R1T 對(duì)比:通常更建議使用 R1T2,除非 R1T 的特定人格是最佳選擇、思考 token 問題不重要,或者極度需求速度。
  • 與 DeepSeek V3-0324 對(duì)比:V3 速度更快,如果不太關(guān)注智能可以選擇 V3;但是,如果需要推理能力,R1T2 是首選。

此外,R1T2 的幾點(diǎn)局限性表現(xiàn)在:

  • R1-0528 雖推理耗時(shí)更長(zhǎng),但在高難度基準(zhǔn)測(cè)試中仍優(yōu)于 R1T2;
  • 經(jīng) SpeechMap.ai(由 xlr8harder 提供)測(cè)評(píng),R1T2 應(yīng)答克制度(reserved)顯著高于 R1T,但低于 R1-0528;
  • 暫不支持函數(shù)調(diào)用:受 R1 基模型影響,現(xiàn)階段不推薦函數(shù)調(diào)用密集型場(chǎng)景(后續(xù)版本可能修復(fù));
  • 基準(zhǔn)測(cè)試變更說(shuō)明:開發(fā)版由 AIME24+MT-Bench 變更為 AIME24/25+GPQA-Diamond 測(cè)評(píng)體系,新體系下 R1 與初代 R1T 的分差較早期公布數(shù)據(jù)更大。

最后,關(guān)于 R1T2 中重要的 AoE 技術(shù),可以參考以下論文。



  • 論文標(biāo)題:Assembly of Experts: Linear-time construction of the Chimera LLM variants with emergent and adaptable behaviors
  • 論文地址:https://arxiv.org/pdf/2506.14794

參考鏈接:https://x.com/tngtech/status/1940531045432283412

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
五戰(zhàn)25帽全美排名跌99!郇斯楠已收10份offer 名嘴:蓋帽強(qiáng)籃板差

五戰(zhàn)25帽全美排名跌99!郇斯楠已收10份offer 名嘴:蓋帽強(qiáng)籃板差

顏小白的籃球夢(mèng)
2025-07-05 14:21:56
羅斯威爾事件:外星人透露驚人內(nèi)幕,地球是牢獄,靈魂永恒存在

羅斯威爾事件:外星人透露驚人內(nèi)幕,地球是牢獄,靈魂永恒存在

吳學(xué)華看天下
2023-07-12 14:16:30
刪視頻改標(biāo)題!穿恨天高踩剎車的女網(wǎng)紅,給雷軍補(bǔ)了一刀

刪視頻改標(biāo)題!穿恨天高踩剎車的女網(wǎng)紅,給雷軍補(bǔ)了一刀

雷科技
2025-07-03 14:54:52
月薪九千胖東來(lái)殺魚姐離職后悔了,她沒想到自己只是捆螃蟹的繩子

月薪九千胖東來(lái)殺魚姐離職后悔了,她沒想到自己只是捆螃蟹的繩子

漣漪讀史
2025-05-11 18:30:59
美國(guó)軍援被切斷了,俄軍一個(gè)月攻占32個(gè)村莊:澤連斯基已在劫難逃

美國(guó)軍援被切斷了,俄軍一個(gè)月攻占32個(gè)村莊:澤連斯基已在劫難逃

帥先工場(chǎng)
2025-07-05 23:32:02
大公報(bào)再次聲討李嘉誠(chéng),口吻已經(jīng)變得超級(jí)嚴(yán)厲!就問老李怕不怕?

大公報(bào)再次聲討李嘉誠(chéng),口吻已經(jīng)變得超級(jí)嚴(yán)厲!就問老李怕不怕?

翻開歷史和現(xiàn)實(shí)
2025-05-03 12:33:51
阿富汗臨時(shí)政府什么情況?

阿富汗臨時(shí)政府什么情況?

新民周刊
2025-07-05 09:07:47
計(jì)劃生育導(dǎo)致妻兒慘死,他一人對(duì)抗6000軍警,單手換彈震動(dòng)世界

計(jì)劃生育導(dǎo)致妻兒慘死,他一人對(duì)抗6000軍警,單手換彈震動(dòng)世界

阿胡
2023-11-21 15:49:13
東亞杯首戰(zhàn)韓國(guó)隊(duì),國(guó)足用以下11人組成首發(fā),能爆冷拿下勝利嗎?

東亞杯首戰(zhàn)韓國(guó)隊(duì),國(guó)足用以下11人組成首發(fā),能爆冷拿下勝利嗎?

小火箭愛體育
2025-07-05 22:38:05
7月買菜,建議少買這7樣蔬菜,都是反季節(jié)的,不好吃還沒營(yíng)養(yǎng)

7月買菜,建議少買這7樣蔬菜,都是反季節(jié)的,不好吃還沒營(yíng)養(yǎng)

暢談裝修
2025-07-02 18:28:25
零電費(fèi)空調(diào)真來(lái)了!董明珠這次又顛覆企業(yè):不用交電費(fèi)的黑科技

零電費(fèi)空調(diào)真來(lái)了!董明珠這次又顛覆企業(yè):不用交電費(fèi)的黑科技

輝哥說(shuō)動(dòng)漫
2025-07-03 09:49:17
國(guó)產(chǎn)辦公軟件三十年:CCED與WPS遭遇最大困境,新勢(shì)力已普及

國(guó)產(chǎn)辦公軟件三十年:CCED與WPS遭遇最大困境,新勢(shì)力已普及

我不叫阿哏
2025-07-05 09:26:54
江西一縣公安局黨委委員任上被查,曾表示要為守護(hù)人民幸福安寧發(fā)揮光和熱

江西一縣公安局黨委委員任上被查,曾表示要為守護(hù)人民幸福安寧發(fā)揮光和熱

瀟湘晨報(bào)
2025-07-05 08:55:05
鹿晗青島演唱會(huì)造型大改,帥回韓流時(shí)期,狀態(tài)真好!

鹿晗青島演唱會(huì)造型大改,帥回韓流時(shí)期,狀態(tài)真好!

科學(xué)發(fā)掘
2025-07-05 13:47:13
2號(hào)種子張帥/阿雷瓦洛擊敗詹皓晴/戈蘭松,晉級(jí)溫網(wǎng)混雙第二輪

2號(hào)種子張帥/阿雷瓦洛擊敗詹皓晴/戈蘭松,晉級(jí)溫網(wǎng)混雙第二輪

直播吧
2025-07-05 21:34:25
盤后傳來(lái)利好!剛剛定調(diào),A股明天或?qū)⒂瓉?lái)新一輪行情?

盤后傳來(lái)利好!剛剛定調(diào),A股明天或?qū)⒂瓉?lái)新一輪行情?

悠然安晴
2025-07-06 00:05:38
上海持續(xù)高溫“霸榜”急診激增,有糖尿病人吃西瓜解暑差點(diǎn)要了命……

上海持續(xù)高溫“霸榜”急診激增,有糖尿病人吃西瓜解暑差點(diǎn)要了命……

上觀新聞
2025-07-05 20:50:10
10年一遇,今年三伏天不一般,7月20日入伏,建議提前做好準(zhǔn)備

10年一遇,今年三伏天不一般,7月20日入伏,建議提前做好準(zhǔn)備

市井覓食記
2025-07-05 01:31:53
2比3!被絕殺!34歲世界冠軍爆大冷一輪游,王楚欽沖冠希望大增

2比3!被絕殺!34歲世界冠軍爆大冷一輪游,王楚欽沖冠希望大增

體壇知道分子
2025-07-05 09:00:23
美軍核航母帶頭沖鋒,掩護(hù)菲艦沖闖黃巖島,解放軍轟-6K掛彈起飛

美軍核航母帶頭沖鋒,掩護(hù)菲艦沖闖黃巖島,解放軍轟-6K掛彈起飛

安珈使者啊
2025-07-05 19:15:59
2025-07-06 01:08:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
10788文章數(shù) 142354關(guān)注度
往期回顧 全部

科技要聞

盤古團(tuán)隊(duì)回應(yīng)抄襲事件:嚴(yán)格遵循開源要求

頭條要聞

外媒:對(duì)以襲擊感到憤怒和警惕 沙特將與伊朗保持和解

頭條要聞

外媒:對(duì)以襲擊感到憤怒和警惕 沙特將與伊朗保持和解

體育要聞

史上最真實(shí)的F1電影,是怎么拍出來(lái)的?

娛樂要聞

汪小菲帶娃出游 馬筱梅小玥兒感情超好

財(cái)經(jīng)要聞

特朗普簽署 美國(guó)萬(wàn)億減稅支出法來(lái)了

汽車要聞

31.6萬(wàn)元起售 蔚來(lái)新ET5/ET5T/EC6冠軍紀(jì)念版上市

態(tài)度原創(chuàng)

數(shù)碼
旅游
房產(chǎn)
公開課
軍事航空

數(shù)碼要聞

同德推出更薄 RTX 5070 (Ti) GamingPro-S 顯卡,RGB 燈僅限正面

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產(chǎn)要聞

湖畔微醺夜,與全球大生活家共赴世界莊園理想生活之約

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以方收到哈馬斯對(duì)停火提案回應(yīng) 或在多哈間接談判

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 肇源县| 外汇| 象山县| 萨嘎县| 淮滨县| 凤凰县| 玛沁县| 印江| 抚州市| 南昌市| 儋州市| 定结县| 洪泽县| 汾阳市| 广灵县| 龙州县| 平阳县| 台中市| 丹江口市| 瑞安市| 和静县| 湖州市| 墨江| 安化县| 焦作市| 临漳县| 澜沧| 湖南省| 家居| 海丰县| 苏尼特右旗| 德化县| 米泉市| 惠安县| 乌兰浩特市| 永兴县| 化德县| 武威市| 从化市| 丰原市| 抚远县|