99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-R1今天一次小更新,顛覆了大模型格局,網友:盡快放R2

0
分享至



超出所有人的期待。

千呼萬喚始出來,DeepSeek 迎來了推理模型更新。



昨晚,DeepSeek 官方宣布其 R1 推理模型升級到了最新版本(0528),并在今天凌晨公開了模型及權重。



HuggingFace 鏈接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

模型文件上傳時間是凌晨 1 點,不知 DeepSeek 工程師們是不是加班到了最后一刻。也有網友表示,這回又在端午節假期前發新模型,簡直比放假通知還靠譜。



這次更新的升級版 R1 參數量高達 6850 億,體量巨大,雖然開源了出來,但大多數人只能圍觀。如果「滿血版」不進行蒸餾,是肯定無法在消費級硬件上本地運行的。

不過這種不說話直接放鏈接的態度還是引來了網友們的普遍歡迎。



根據 DeepSeek 的小范圍通知,更新后的 R1 版本采用 MIT 許可證,這意味著它可以用于商業用途,從版本號看來這是一個「小」升級,不過人們大量實測后發現,新版大模型的性能提升頗為明顯。

我們也能在新版 DeepSeek-R1 模型的配置文件中看到更多但并不出人意料的信息,包括采用了 DeepSeek-V3 作為基礎模型以及 MoE、隱藏層大小、量化等配置。



我們現在已經可以在 DeepSeek 的網頁端和 App 上直接用上這個最新版本的大模型。

有網友總結表示,新的 DeepSeek-R1-0528 可以進行更加深度的推理,輸出的文本更加自然,結構更有層次感,它展現出了獨特的推理風格,不僅速度很快,而且進行了充分的思考。與上周發布的 Claude4 類似,現在的 DeepSeek 也可以進行長時間的思考了,據說能持續 30-60 分鐘。



已經有一些網友實測時遇到了 DeepSeek 的長考,這 deep research 可夠深度的:



基準評分,成績大幅提升

DeepSeek R1 發布以來,大模型領域的格局已經發生了變化。原版 R1 的成績如今已不再領先,R1-0528 的出現修正了結果。

R1-0528 模型的第一個 Benchmark 成績是 LiveCodeBench,它超越了 O3-Mini,幾乎與 O3(High)的評分相當,在編程任務上相比上個版本有了顯著的提升。



要知道 DeepSeek 模型是完全開源的,App 目前為止也完全免費,這可以說是開源的勝利。

另外,其在 Extended NYT Connections 基準上的成績也已經出爐,相比于前一代 DeepSeek-R1,最新的 0528 版本的提升非常明顯,從 38.6 增至了 49.8,接近 Claude Opus 4 Thinking 16k;不過在該基準上,DeepSeek-R1-0528 仍舊沒有擠進 OpenAI o 系列模型占據的第一梯隊。



目前,ChatBot Arena 上也已經更新了新版本的 DeepSeek R1,讓我們看看大家充分測試過后它的排名能爬到多高。



網友實測:代碼能力大幅提升

雖然 DeepSeek-R1-0528 才剛出來不久,但已經有不少網友分享了自己的實測結果。

比如開發者 Haider 就通過一個編程挑戰賽(構建一個詞評分系統)挑戰了當前主流的前沿模型,結果發現,目前只有 o3 和新版 DeepSeek-R1 能夠完成這個挑戰。這不禁讓他感嘆:DeepSeek is so back...



也有網友通過一個小球撞墻實驗直觀地對比了 Claude-4-Sonnet 與 DeepSeek-R1-0528 的實際表現。可以看到,DeepSeek-R1 生成的代碼在模擬物理碰撞方面表現會更好一些。



Hyperbolic Labs CTO 和聯創 Yuchen Jin 也進行了簡單測試,發現 R1-0528 是目前唯一一個始終能正確回答「what is 9.9 - 9.11?」的模型。



下面是他錄制的演示視頻:


機器之心也做了一次簡單的嘗試,讓其用 Python 編寫了一個可以將 Word 文檔中的圖片提取到固定路徑的小程序。


可以看到,DeepSeek-R1 用一分多鐘完成了任務,那實際效果如何呢?很遺憾,出現了一個報錯:



這是一個簡單的句法錯誤,下面我們直接將其反饋給 R1-0528。結果出現了一個有趣的現象,對于這個簡單報錯,R1 模型思考的時間(212 秒)遠遠超過了之前寫出整個程序的時間。



查看其思考過程可知,新版本的 R1 與之前的版本一樣存在過度思考的問題,即反復思考和驗證原本很簡單的問題。

不過好在,修改后的程序成功完成了指定任務,就是這 UI 字體有點不協調:



我們還進行了另一些簡單測試。整體來說,我們感覺新版 DeepSeek-R1 相比前一版本確實提升不小,完成一個任務所需的對話輪次也少了許多。

最后,盡管 R1 這次提升很大,網友們還是期待 DeepSeek 盡快放出 R2。



一個小版本更新就如此驚艷,DeepSeek R2 會是什么樣子?這一次,我們是不是要等到國慶節?

文中視頻鏈接:https://mp.weixin.qq.com/s/14YOsEZ_Kr6MD-7qvm3Hgg

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
朱媛媛的字體,讓多少書協會員汗顏

朱媛媛的字體,讓多少書協會員汗顏

八斗小先生
2025-05-25 16:41:13
印度26歲男子強奸16歲未成年女孩 被判入獄后申請保釋 法院批準其保釋與受害者結婚 引發眾怒

印度26歲男子強奸16歲未成年女孩 被判入獄后申請保釋 法院批準其保釋與受害者結婚 引發眾怒

閃電新聞
2025-05-29 15:54:05
大S女兒來北京過端午!馬筱梅帶她喝下午茶,小玥兒低著頭好乖巧

大S女兒來北京過端午!馬筱梅帶她喝下午茶,小玥兒低著頭好乖巧

古希臘掌管月桂的神
2025-05-30 18:18:41
“家里沒錢供你了”,女大學生因為考研跟父母決裂,網友看破真相

“家里沒錢供你了”,女大學生因為考研跟父母決裂,網友看破真相

妍妍教育日記
2025-05-27 20:41:30
山東再次發生爆炸!

山東再次發生爆炸!

財經要參
2025-05-29 23:28:03
女子長期占用公共車位,泄憤推倒上萬輛自行車后續:車主拒不諒解

女子長期占用公共車位,泄憤推倒上萬輛自行車后續:車主拒不諒解

阿綏談史
2025-05-30 15:42:23
寧夏哈納斯燃氣集團有限公司原黨委書記、董事長、國有資產出資代表人杜彥忠被查

寧夏哈納斯燃氣集團有限公司原黨委書記、董事長、國有資產出資代表人杜彥忠被查

界面新聞
2025-05-30 16:30:18
選秀之王!雷霆GM封神,普雷斯蒂選中3MVP+交易1MVP,7季50勝

選秀之王!雷霆GM封神,普雷斯蒂選中3MVP+交易1MVP,7季50勝

球童無忌
2025-05-30 15:56:15
年薪2250萬歐!西媒:皇馬考慮支付500萬歐,提前1年解約阿拉巴

年薪2250萬歐!西媒:皇馬考慮支付500萬歐,提前1年解約阿拉巴

直播吧
2025-05-29 22:32:08
美國斷供C919發動機,國產長江1000:機會來了!

美國斷供C919發動機,國產長江1000:機會來了!

52赫茲實驗室
2025-05-30 15:06:25
特朗普政府關稅政策又恢復了,僅暫停一天

特朗普政府關稅政策又恢復了,僅暫停一天

鳳凰衛視
2025-05-30 11:00:39
為什么現在單親媽媽越來越多?網友:她以為離婚后會很搶手啊!

為什么現在單親媽媽越來越多?網友:她以為離婚后會很搶手啊!

美好客棧大掌柜
2025-01-28 00:15:02
痛風的“禍根”找到了,醫生警示:3種食物再吃,會讓你下不了地

痛風的“禍根”找到了,醫生警示:3種食物再吃,會讓你下不了地

本草世界
2025-05-30 09:00:03
機場偶遇張天愛,穿上牛仔褲,難掩她迷人的好身材

機場偶遇張天愛,穿上牛仔褲,難掩她迷人的好身材

皮蛋兒電影
2025-05-30 14:25:42
67歲王朔近況曝光:住北京漏雨老房子,面容蒼老身體變差很怕冷

67歲王朔近況曝光:住北京漏雨老房子,面容蒼老身體變差很怕冷

悠閑歷史
2025-05-30 10:58:48
豐田4月全球銷量同比增長12.2%

豐田4月全球銷量同比增長12.2%

界面新聞
2025-05-29 13:39:52
白宮稱美國法院“叫停”關稅是司法越權!美政府已提出緊急動議,要求在上訴期暫緩執行判決

白宮稱美國法院“叫停”關稅是司法越權!美政府已提出緊急動議,要求在上訴期暫緩執行判決

每日經濟新聞
2025-05-30 08:49:10
報告:過半受訪大學生認為婚育不重要,七成接受結婚但不生孩子,建議在基礎教育與高等教育階段開設婚戀教育課程

報告:過半受訪大學生認為婚育不重要,七成接受結婚但不生孩子,建議在基礎教育與高等教育階段開設婚戀教育課程

金融界
2025-05-30 14:57:43
第一集就用血腥開顱術迎接觀眾,果然夠真實,夠炸裂

第一集就用血腥開顱術迎接觀眾,果然夠真實,夠炸裂

有尺度影視
2025-05-30 10:38:03
中國隊喜獲“上上簽”,抽中兩大魚腩隊,力拼澳大利亞爭第一!

中國隊喜獲“上上簽”,抽中兩大魚腩隊,力拼澳大利亞爭第一!

綠茵舞著
2025-05-29 23:44:29
2025-05-30 18:59:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10561文章數 142329關注度
往期回顧 全部

科技要聞

理想真正硬仗是i8/i6!要如何迎戰小米YU7

頭條要聞

小伙睡夢中被貸款5萬:看手機在自己輸密碼頭皮都麻了

頭條要聞

小伙睡夢中被貸款5萬:看手機在自己輸密碼頭皮都麻了

體育要聞

當我終于回國時,可能已認不出我的家

娛樂要聞

趙麗穎新劇撲街?演技扛劇能力遭質疑

財經要聞

美國政府殺瘋了,全世界目瞪口呆

汽車要聞

可城能野更智能 猛士M817把硬派SUV玩出花

態度原創

房產
藝術
健康
手機
教育

房產要聞

清盤倒計時!這個天河芯紅盤,贏的不止多一點!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

唇皰疹和口腔潰瘍是"同伙"嗎?

手機要聞

蘋果單周份額蟬聯榜一:iPhone16 Pro單周激活近80萬

教育要聞

德州市齊河縣教體局:創新心理健康教育模式,心理+藝體融合課程探索

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 梁平县| 龙里县| 湖州市| 肥西县| 喜德县| 洛南县| 额尔古纳市| 宽城| 大同县| 郎溪县| 中西区| 乌恰县| 静乐县| 铅山县| 江阴市| 嘉善县| 山阴县| 临夏市| 山阳县| 长沙市| 石狮市| 鄱阳县| 天镇县| 施秉县| 连平县| 卢氏县| 扎兰屯市| 同心县| 乡城县| 太仓市| 武威市| 益阳市| 襄垣县| 万宁市| 建湖县| 宁河县| 甘肃省| 宣城市| 大理市| 灵石县| 内乡县|