99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<style id="733uc"></style>

<table id="733uc"></table>

<del id="733uc"><option id="733uc"><table id="733uc"></table></option></del>

<var id="733uc"></var>

<em id="733uc"><option id="733uc"></option></em>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

英偉達突然開源新模型！性能直逼 DeepSeek-R1，4 倍推理吞吐量卷翻天

2025-04-09 12:56:05　來源: AppSo

廣東舉報

0

分享至

今天，英偉達開源了一款名為 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型。

該模型基于 Meta 早期的 Llama-3.1-405B-Instruct 模型開發(fā)，擁有 2530 億個參數(shù)，在多項第三方基準測試中表現(xiàn)出色。

英偉達新模型的性能逼近擁有 6710 億參數(shù)的 DeepSeek R1，但只用了不到一半的參數(shù)量。

測試結果顯示，GPQA（76 vs. 71.5）、IFEval 指令遵循（89.5 vs. 88.8）和 LiveCodeBench 編碼任務（66.3 vs. 65.9）。

并且，Llama-3.1-Nemotron-Ultra-253B 推理吞吐量也比 DeepSeek R1 671B 高 4 倍。

不過，在 MATH500 和 Arena Hard 基準測試中，DeepSeek R1 仍略占優(yōu)勢。

據(jù)悉，Llama-3.1-Nemotron-Ultra-253B 的設計目標是支持高級推理、指令遵循以及 AI 助手工作流程。

技術特點如下：
1?? 采用神經(jīng)架構搜索(NAS)優(yōu)化架構
2?? 引入跳躍注意力層、融合前饋網(wǎng)絡(FFN)和可變 FFN 壓縮率
3?? 降低內存占用和計算需求，保持輸出質量
4?? 可在單個 8x H100 GPU 節(jié)點高效部署
5?? 部署支持 B100 和 Hopper 微架構硬件
6?? 在 BF16 和 FP8 精度模式下均驗證通過

目前，該模型的代碼已在 Hugging Face 平臺上公開，包含開放的權重和訓練后數(shù)據(jù)。

Llama-3.1-Nemotron-Ultra-253B 可用于聊天機器人開發(fā)、AI Agent 工作流、檢索增強生成（RAG）和代碼生成等場景。根據(jù)英偉達開放模型許可證及 Llama 3.1 社區(qū)許可協(xié)議，該模型已獲準用于商業(yè)用途。

附上體驗地址：
https://build.nvidia.com/nvidia/llama-3_1-nemotron-ultra-253b-v1?ncid=so-twit-273200

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

400萬token新SOTA！英偉達UIUC聯(lián)手：兼顧長短上下文頂尖性能

新智元 2025-05-01 09:39:50
0 跟貼 0
DeepSeek開源數(shù)學模型Prover-V2-671B ，較上代參數(shù)量提高近百倍

DeepTech深科技 2025-04-30 21:19:02
7 跟貼 7

DeepSeek公布Prover-V2技術報告，定理證明達到業(yè)內最佳

DeepTech深科技 2025-05-01 19:17:23
36 跟貼 36

登頂開源大模型榜首阿里Qwen3成色如何？|聚焦

財聯(lián)社 2025-05-01 19:34:10
3 跟貼 3
ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
5 跟貼 5

人人都能有一個滿血DeepSeek？清華90后出手，10萬塊暢玩FP8原版

新智元 2025-04-30 12:43:32
60 跟貼 60

江西新首富，踩著英偉達，狂賺700億

華商韜略 2025-02-06 10:40:25
471 跟貼 471
英偉達開源「描述一切」模型

機器之心Pro 2025-04-25 18:59:37
0 跟貼 0

英偉達拿下7個基準SOTA，鼠標點哪就講哪，真能描述一切！

機器之心Pro 2025-04-28 19:09:27
0 跟貼 0
黃仁勛：人格是被捶打塑造出來的，從容接受社會的毒打吧！網(wǎng)友點評：被特不靠普錘爆來中國求助了

大白聊IT 2025-04-29 10:38:55
4 跟貼 4
新CEO改革見效！英特爾14A工藝進度曝光，還有“X3D”

雷科技 2025-05-01 12:04:53
7 跟貼 7
英偉達CEO黃仁勛：中國AI并不落后華為是最強大科技公司之一！

叫叫科普樂園 2025-05-02 03:28:54
2 跟貼 2
英偉達 CEO 黃仁勛最新涉華表態(tài)！

上觀新聞 2025-05-01 16:19:50
0 跟貼 0
它不得不被鎖在里面，是時候展示真正的技術了

世界生活點滴 2025-04-30 15:13:41
6 跟貼 6
英偉達黃仁勛帶GPU去白宮跟川普一起開發(fā)布會！

半身Naked 2025-05-01 09:45:24
0 跟貼 0
誰來給中國大模型落地打個樣？

虎嗅APP 2024-11-25 21:32:09
11 跟貼 11
黃仁勛在美國又穿西裝表態(tài)，怎么看？

新民晚報 2025-05-02 10:08:22
1 跟貼 1
后Transformer時代，AI將何去何從？（下）｜【十萬字】深度研報

鈦媒體APP 2025-01-01 20:46:37
0 跟貼 0
2025，Agent生死競速

鈦媒體APP 2025-01-08 19:18:23
0 跟貼 0
AI作圖，拯救“職場牛馬”

鈦媒體APP 2025-01-17 13:25:28
1 跟貼 1
國產(chǎn)汽車芯片暗戰(zhàn)上海車展

第一財經(jīng)資訊 2025-04-30 20:56:30
4 跟貼 4
董襲瑩事情新進展，DeepSeek立功，網(wǎng)傳論文細節(jié)令人氣憤

一桶漿糊要一統(tǒng)江湖 2025-05-01 18:32:02
596 跟貼 596
英偉達CEO黃仁勛:如今制造業(yè)早已不是靠廉價勞動力取勝！

ConfusionMax 2025-05-01 13:51:22
350 跟貼 350
AI Phone：先是芯片，再是模型，最后才是手機廠商

鈦媒體APP 2024-11-08 19:44:25
3 跟貼 3
這是買的新能源電車還是買的拖拉機啊

小火柴視頻 2025-05-01 17:25:10
5942 跟貼 5942
黃仁勛勸特朗普：得改，中國緊追其后

觀察者網(wǎng) 2025-05-01 10:35:13
1 跟貼 1
擔心車主城市開快車，SU7 Ultra開始限制馬力

映射生活的身影 2025-05-01 22:02:05
8 跟貼 8
DeepSeek：中年人最無聲的炫富，你占幾條？

十點讀書 2025-05-01 18:37:44
32 跟貼 32
寶寶的硬件條件隨爸爸和媽媽誰更多一點？

民生大參考 2025-04-28 12:26:21
1 跟貼 1
戰(zhàn)國時代的科幻小說《偃師造人》，老祖宗的仿生機器人長什么樣？

九江老渭 2025-04-28 12:17:12
5 跟貼 5
一年虧千億，裁員2.2萬人，壟斷40年巨頭進入生死年

鈦媒體APP 2025-05-02 11:20:12
0 跟貼 0
吊車師傅晃動掛鉤，趁其不備套上繩索固定，網(wǎng)友：這是門技術活

新知速報 2025-04-30 15:09:22
2 跟貼 2
印度這座古老的寺廟是用一種至今我們無法解釋的技術建造的！

地鐵動畫 2025-05-01 16:10:55
1 跟貼 1
5000名游客擠癱政府食堂：米飯蒸了1000多斤，飯碗都不夠了

環(huán)球網(wǎng)資訊 2025-05-01 19:13:58
2833 跟貼 2833
增程動力架構未來方向會是如何？聽華為智能電動技術專家如何解析

分秒汽車 2025-04-30 17:51:58
4 跟貼 4
Yann LeCun：我對大語言模型沒興趣，這四個領域更有趣

機器之心Pro 2025-04-15 14:07:54
0 跟貼 0
DeepSeek時代，什么樣的孩子不會被淘汰？這3套成長秘籍正在北上廣家長圈瘋傳！

晏凌羊 2025-05-01 19:41:04
0 跟貼 0
胡金全詩歌《登華林山》及Deepseek評析

經(jīng)典詩書畫 2025-05-02 12:45:16
0 跟貼 0
0-3橫掃！揪出遼籃兩大罪人，創(chuàng)兩恥辱紀錄，誰注意趙繼偉舉動

樂聊球 2025-05-01 21:28:23
1630 跟貼 1630
數(shù)字警察、無人機、機器狗，南京夫子廟 “數(shù)智天團” 上崗

現(xiàn)代快報 2025-05-02 13:57:36
0 跟貼 0

陳芋汐全紅嬋包攬冠亞軍，妹妹全紅嬋經(jīng)歷成長陣痛

陳芋汐全紅嬋包攬冠亞軍，妹妹全紅嬋經(jīng)歷成長陣痛

上觀新聞

2025-04-13 15:43:04

被多國退貨，演習不敵殲10C，實戰(zhàn)被擊落，中國的蘇35還有啥用？

被多國退貨，演習不敵殲10C，實戰(zhàn)被擊落，中國的蘇35還有啥用？

悄悄史話

2025-04-30 11:16:43

日媒驚呼：中國移民正在重塑東京，23區(qū)有可能將成為一個巨大的“中國縣城”

日媒驚呼：中國移民正在重塑東京，23區(qū)有可能將成為一個巨大的“中國縣城”

掘金日本房產(chǎn)

2025-04-29 22:09:20

董小姐和肖醫(yī)生撕破臉不結婚了：即將出生的孩子選媽不如選爹靠譜

董小姐和肖醫(yī)生撕破臉不結婚了：即將出生的孩子選媽不如選爹靠譜

二月侃事

2025-04-30 14:15:56

楊振寧和奶奶的合影，這坐姿有點不合適，長輩在，晚輩需要站著

楊振寧和奶奶的合影，這坐姿有點不合適，長輩在，晚輩需要站著

大江

2025-04-10 13:23:55

特朗普稱將禁止伊朗石油買家與美國做生意

特朗普稱將禁止伊朗石油買家與美國做生意

界面新聞

2025-05-02 07:06:49

江西旅行社火了，游客不消費就被導游扔山里，手段遠比想象中可怕

江西旅行社火了，游客不消費就被導游扔山里，手段遠比想象中可怕

寒士之言本尊

2025-04-30 23:21:57

最大規(guī)模財務造假！虛增收入645億、套現(xiàn)169億，16萬投資者被套牢

最大規(guī)模財務造假！虛增收入645億、套現(xiàn)169億，16萬投資者被套牢

影史侃談

2025-04-29 22:05:06

她因年輕漂亮被導演占為己有，16年后老公故技重施，再抱得美人歸

她因年輕漂亮被導演占為己有，16年后老公故技重施，再抱得美人歸

追風小狗

2025-05-01 23:20:16

18元3個菜，旅游第一餐直奔政府食堂！浙江一地又“寵客”了

18元3個菜，旅游第一餐直奔政府食堂！浙江一地又“寵客”了

瀟湘晨報

2025-05-02 07:46:09

天生壞種？被判10年的李天一出獄后，最惡心的一幕還是出現(xiàn)了

天生壞種？被判10年的李天一出獄后，最惡心的一幕還是出現(xiàn)了

小啾咪侃侃史

2024-09-07 15:30:03

續(xù)航1000km電車五一高速實測600km！車主：省油錢被割韭菜？

續(xù)航1000km電車五一高速實測600km！車主：省油錢被割韭菜？

科技迷行行

2025-05-01 13:09:39

干擾北斗衛(wèi)星導航系統(tǒng)！印軍第三次作戰(zhàn)斗準備，會影響到國內嗎？

干擾北斗衛(wèi)星導航系統(tǒng)！印軍第三次作戰(zhàn)斗準備，會影響到國內嗎？

大風文字

2025-05-02 12:43:43

林彪去世40周年后，他的墓前出現(xiàn)了七個人，來看都是誰？

林彪去世40周年后，他的墓前出現(xiàn)了七個人，來看都是誰？

歷史1949

2025-01-19 22:21:37

如何從易疲勞體質，變成一個精力充沛的人？

如何從易疲勞體質，變成一個精力充沛的人？

互聯(lián)網(wǎng)思維

2024-11-04 23:35:33

八旬老人與已故兒子女友結婚，其女兒拿斧頭怒砸家門！新婚妻子正面回應

八旬老人與已故兒子女友結婚，其女兒拿斧頭怒砸家門！新婚妻子正面回應

瀟湘晨報

2025-04-30 21:39:43

一路走好?！布彭扎遺體抵達祖國加蓬，將舉行全國性哀悼儀式

一路走好?！布彭扎遺體抵達祖國加蓬，將舉行全國性哀悼儀式

直播吧

2025-05-01 18:41:15

超模蔣怡淺褐造型性感韻味十足

述家娛記

2025-05-02 06:59:01

全紅嬋雙人十米臺搭檔換人？張佳琪臨陣頂替引熱議

全紅嬋雙人十米臺搭檔換人？張佳琪臨陣頂替引熱議

馬鈴薯椰

2025-05-02 07:30:18

為何美航天員走著出來，中國航天員卻被抬出臉部浮腫

為何美航天員走著出來，中國航天員卻被抬出臉部浮腫

白面書誏

2025-04-30 18:27:47

讓智能手機更好用的秘密

5308文章數(shù) 26566關注度

往期回顧全部

科技要聞

在華不及預期！蘋果稱關稅將增9億美元成本

頭條要聞

五一首日7000名游客涌入榮昌政府食堂:吃掉1500斤豬肉

頭條要聞

五一首日7000名游客涌入榮昌政府食堂:吃掉1500斤豬肉

體育要聞

為了湖人的28號秀，森林狼差點沒換來戈貝爾

娛樂要聞

霍啟剛郭晶晶夫婦現(xiàn)身馬麗新片首映

財經(jīng)要聞

黃仁勛在美國又穿西裝表態(tài)，怎么看？

汽車要聞

全路況大格局前路山海皆坦途

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

旅游

健康

公開課

軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

唇皰疹和口腔潰瘍是"同伙"嗎？

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
全球十大恐怖禁區(qū)有哪些？
李彥宏：百度離破產(chǎn)30天

軍事要聞

美航母撞船后又將戰(zhàn)機甩進海里專家：艦員高度緊張

© 1997-2025 網(wǎng)易公司版權所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：合山市| 永年县| 西充县| 南汇区| 江西省| 荥经县| 广丰县| 泸定县| 澜沧| 南昌市| 湖口县| 旺苍县| 横山县| 沁源县| 冀州市| 随州市| 宣威市| 乐亭县| 长春市| 永嘉县| 社旗县| 浦北县| 牡丹江市| 望城县| 启东市| 靖宇县| 大化| 敦化市| 桐梓县| 镇沅| 绥滨县| 营口市| 东至县| 江都市| 鱼台县| 周宁县| 时尚| 潞西市| 治多县| 翁牛特旗| 化隆|

<thead id="ngiod"></thead>