99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不只是“小升級”!DeepSeek-R1新版獲海外盛贊,每經(jīng)記者親測挑戰(zhàn)三大編程任務(wù)

0
分享至

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平臺開源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,用戶可通過官方網(wǎng)頁、App、小程序進(jìn)行測試(打開深度思考),API接口和使用方式保持不變。

在此次更新中,模型代碼能力的提升最為顯著。知名代碼測試平臺LiveCodeBench顯示,更新后的R1性能可以媲美OpenAI o3模型的高版本。

除代碼能力外,R1新版本模型的文本理解與推理能力亦實現(xiàn)跨越式升級。其上下文長度拓展至128k,長文本提取的準(zhǔn)確率也有顯著提升。

《每日經(jīng)濟(jì)新聞》記者(以下簡稱“每經(jīng)記者”)通過俄羅斯方塊游戲開發(fā)、太陽系模擬與交互展示,以及設(shè)計英偉達(dá)最新財報網(wǎng)頁這三項任務(wù)對R1新版本進(jìn)行了實測,發(fā)現(xiàn)DeepSeek-R1-0528的編程能力確實強(qiáng)大,對物理世界的理解以及文本的提取都相當(dāng)準(zhǔn)確。

知名AI評論人Haider在社交媒體上評價稱,這是開源的一大勝利。

瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang則表示,在這一“小”進(jìn)步之后,我們確實可以期待更大突破(DeepSeek-R2)的到來。


圖片來源:Hugging Face

“小升級”實現(xiàn)“大跨越”:升級后的R1性能媲美o3模型高版本

DeepSeek延續(xù)了其一貫的低調(diào)風(fēng)格,此次升級率先在微信群進(jìn)行官宣,并輕描淡寫地將其定義為“小版本升級”。

然而,眾多開發(fā)者實測后發(fā)現(xiàn),此次的“小”升級,并不小。升級后的DeepSeek-R1,模型能力可以說實現(xiàn)了跨越式提升。


圖片來源:DeepSeek官方微信群截圖

編碼能力方面,代碼測試平臺LiveCodeBench顯示,更新后的DeepSeek-R1性能接近OpenAI在4月中旬發(fā)布的o4-mini和o3模型高版本。

據(jù)測試者反饋,DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼,且在HTML/CSS/JS動態(tài)交互實現(xiàn)(如天氣卡片動畫、數(shù)據(jù)可視化)中更加精準(zhǔn)。


圖片來源:代碼測試平臺LiveCodeBench

除代碼能力外,新版本模型的文本理解與推理能力亦實現(xiàn)跨越式升級。其上下文長度拓展至128k,長文本提取的準(zhǔn)確率也有顯著提升

在Extended NYT Connections基準(zhǔn)測試中,相比于前一代DeepSeek-R1,最新的0528版本的提升非常明顯,得分從38.6%大幅升至49.8%。


圖片來源:X

目前,ChatBot Arena也已經(jīng)“上架”了最新版本的DeepSeek-R1,但還沒有任何的測試結(jié)果。


圖片來源:X

記者實測編程能力

為了更全面地測試DeepSeek-R1-0528的編程能力,每經(jīng)記者設(shè)計了三項不同難度和類型的編程任務(wù),包括網(wǎng)頁游戲制作、物理世界模擬、財報可視化,來檢驗其在實際場景中的表現(xiàn)。

任務(wù)一:俄羅斯方塊游戲開發(fā)

作為一款經(jīng)典的休閑游戲,俄羅斯方塊游戲的開發(fā)涉及圖形繪制、游戲邏輯處理、用戶交互等多個方面,能夠很好地考察模型對于綜合編程知識的掌握和運用能力。

每經(jīng)記者首先向DeepSeek-R1提出需求:“請幫我開發(fā)一個網(wǎng)頁端俄羅斯方塊小游戲,要求包含游戲分?jǐn)?shù)、彩色方塊及多個關(guān)卡。”

DeepSeek僅思考了7秒,就開始輸出代碼。然而,初步生成的游戲無法正常運作,雖有預(yù)設(shè)的分?jǐn)?shù)與關(guān)卡顯示,但游戲區(qū)域內(nèi)并沒有俄羅斯方塊。


圖片來源:由DeepSeek生成

隨后,記者調(diào)整提示詞,僅提了最基礎(chǔ)的要求,“請幫我寫個俄羅斯方塊游戲(網(wǎng)頁端),直接可以上手玩。”

簡潔的指令似乎對DeepSeek-R1-0528更加奏效。這次R1思考9秒,用時約3分30秒便生成了代碼。


圖片來源:由DeepSeek生成

從游戲頁面來看,色彩搭配鮮明且協(xié)調(diào),不同顏色的方塊在深色背景下十分醒目,游戲區(qū)域布局合理,操作說明也清晰明了。

在游戲邏輯方面,方塊的下落、移動和旋轉(zhuǎn)都很流暢,沒有出現(xiàn)延遲或卡頓現(xiàn)象。

可以說,已經(jīng)具備了一個成熟俄羅斯方塊游戲應(yīng)有的功能和體驗。

任務(wù)二:太陽系模擬與交互展示

接下來,難度升級。對于大模型而言,對物理世界進(jìn)行準(zhǔn)確模擬長期以來都是一項極具挑戰(zhàn)性的任務(wù)。

此次,記者特意選取“行星軌道運動的物理模擬”這一任務(wù),在考察其編碼能力的同時,也考察DeepSeek-R1-0528對物理世界的理解能力。

記者向R1提出要求——寫一個太陽系模擬網(wǎng)頁,并且網(wǎng)頁可交互展示。

因為任務(wù)更復(fù)雜,R1思考時間也相應(yīng)變長,耗時54秒后開始輸出代碼。


圖片來源:由DeepSeek生成

可以看出,R1的整體完成度極高,完全可以作為中小學(xué)科普動畫的原型演示。

從界面呈現(xiàn)看,太陽居于中心,八大行星依照各自軌道有序排布,色彩搭配也符合人們對天體的認(rèn)知。此外,行星的大小比例、相對位置都比較精準(zhǔn)。

在交互功能方面,右側(cè)控制面板設(shè)計簡潔且功能豐富。

同時,頁面“行星信息”板塊還以簡潔明了的文字介紹了太陽及各大行星的關(guān)鍵特征,如太陽的質(zhì)量、直徑,水星的公轉(zhuǎn)周期、表面溫度等,兼具科普性與趣味性。

任務(wù)三:設(shè)計英偉達(dá)最新財報網(wǎng)頁

最后,每經(jīng)記者上傳了英偉達(dá)2026財年第一財季財報的文檔,要求R1根據(jù)財報中的內(nèi)容,制作一個可交互的網(wǎng)頁。

財報中數(shù)據(jù)繁雜,文本較長,非常考察模型準(zhǔn)確提取文本的能力。


圖片來源:由DeepSeek生成

DeepSeek-R1生成的網(wǎng)頁令人眼前一亮。在視覺呈現(xiàn)上,網(wǎng)頁采用了標(biāo)志性的“英偉達(dá)綠”,顏色搭配協(xié)調(diào)。

數(shù)據(jù)方面,基本做到了準(zhǔn)確無誤,很少出現(xiàn)“幻覺”情況。此外,模型還繪制了柱狀圖、餅圖等圖表,讓復(fù)雜的數(shù)據(jù)變得一目了然。

盡管可能還存在一些細(xì)微的提升空間。比如,在漲跌幅的顏色上,我們通常用紅色表示上漲,綠色表示下跌。但可能由于記者投喂的是美股公司財報(美股一般用綠色表示上漲,紅色表示下跌),R1用了與之對應(yīng)的顏色來展示漲跌幅。

整體來看,R1已充分彰顯其在復(fù)雜任務(wù)處理上的卓越潛力。

“全球AI競賽關(guān)鍵節(jié)點”!DeepSeek-R1新版獲海外盛贊

DeepSeek最新發(fā)布的R1模型升級版在全球AI領(lǐng)域掀起熱議,多位國際主流科技大佬及行業(yè)高管紛紛發(fā)聲,盛贊其技術(shù)突破。

機(jī)器學(xué)習(xí)研究者kalomaze實測后贊嘆道,“DeepSeek太出色了。”

Hyperbolic Labs聯(lián)合創(chuàng)始人兼首席技術(shù)官Yuchen Jin表示,新版R1似乎是唯一能回答9.9減9.11等于幾的模型。

知名AI評論人Haider直呼,這是開源的一大勝利。“DeepSeek王者歸來了。新版本的DeepSeek-R1在編程方面簡直令人難以置信,這是我測試過的最佳模型。”

AI撰稿人喬治·霍普金(George Hopkin)表示,DeepSeek的R1模型更新后,推理和輸出能力大幅提升,標(biāo)志著中國在全球AI競賽中的影響力日益增強(qiáng)

瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang指出,DeepSeek的最新版R1模型,正悄然成為谷歌Gemini 2.5 Pro的強(qiáng)勁競爭對手。“這一發(fā)展不僅僅是技術(shù)進(jìn)步,更是全球AI競賽中的一個關(guān)鍵節(jié)點。該模型憑借其雙倍輸出能力和增強(qiáng)的數(shù)學(xué)推理能力,展示了中國在AI領(lǐng)域的快速崛起。”

DeepSeek此次更新的亮眼表現(xiàn),為DeepSeek的下一代模型R2注入更多想象空間。Max Zhang表示,在這一“小”進(jìn)步之后,我們確實可以期待更大突破的到來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
最好的防守是進(jìn)攻!面對瘋狂空襲,烏克蘭唯有置死地而后生

最好的防守是進(jìn)攻!面對瘋狂空襲,烏克蘭唯有置死地而后生

史政先鋒
2025-05-28 13:45:42
曝竇驍何超蓮已離婚,男方向女方索要8000萬,兩人已5個月未互動

曝竇驍何超蓮已離婚,男方向女方索要8000萬,兩人已5個月未互動

小咪侃娛圈
2025-05-08 14:36:12
高盛給出長期資產(chǎn)配置建議:未來五年,超配黃金,低配原油!

高盛給出長期資產(chǎn)配置建議:未來五年,超配黃金,低配原油!

財聯(lián)社
2025-05-29 17:45:19
丈夫發(fā)現(xiàn)5歲雙胞胎非親生,卻裝作不知情,又讓妻子再為其生兩個

丈夫發(fā)現(xiàn)5歲雙胞胎非親生,卻裝作不知情,又讓妻子再為其生兩個

蘭姐說故事
2025-05-27 17:00:13
田徑亞錦賽:中國隊再獲金牌,馮彬三連冠短跨接力驚險奪分。

田徑亞錦賽:中國隊再獲金牌,馮彬三連冠短跨接力驚險奪分。

蜜心蘿莉
2025-05-30 12:27:46
網(wǎng)約車驚現(xiàn)"沉默契約":誰在逼瘋出行最后一米?

網(wǎng)約車驚現(xiàn)"沉默契約":誰在逼瘋出行最后一米?

河山銳新聞
2025-05-29 09:35:10
離譜!香港男子在香港銀行借出數(shù)百萬元移民英國開啟新生活?還在網(wǎng)上炫耀永不還錢!香港網(wǎng)友:人無恥便無敵

離譜!香港男子在香港銀行借出數(shù)百萬元移民英國開啟新生活?還在網(wǎng)上炫耀永不還錢!香港網(wǎng)友:人無恥便無敵

澳門月刊
2025-05-29 09:33:23
張學(xué)良90歲時被釋放,記者問他最佩服誰?他毫不猶豫的說出兩個人

張學(xué)良90歲時被釋放,記者問他最佩服誰?他毫不猶豫的說出兩個人

探秘古今
2025-05-21 15:49:18
中央巡視組進(jìn)駐后,“亞洲最大醫(yī)院”原院長被查!

中央巡視組進(jìn)駐后,“亞洲最大醫(yī)院”原院長被查!

上觀新聞
2025-05-29 15:59:07
南京房子賣掉虧了170萬!93年小伙哭訴,這十幾年的奮斗全部歸0…

南京房子賣掉虧了170萬!93年小伙哭訴,這十幾年的奮斗全部歸0…

火山詩話
2025-05-28 05:51:06
中方的安排出乎外界意料,在北京輪流接見美國客人

中方的安排出乎外界意料,在北京輪流接見美國客人

視野聚椒
2025-05-30 14:51:52
枇杷再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):吃枇杷時,千萬多留意這幾點!

枇杷再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):吃枇杷時,千萬多留意這幾點!

39健康網(wǎng)
2025-05-25 20:31:07
如果火勇首輪沒有死磕,那么勇士有可能奪冠,火箭也會走得更遠(yuǎn)!

如果火勇首輪沒有死磕,那么勇士有可能奪冠,火箭也會走得更遠(yuǎn)!

田先生籃球
2025-05-30 12:06:56
張?zhí)m遭圍剿!被控偽造大S簽名貸款4900萬買房,本人回應(yīng)!

張?zhí)m遭圍剿!被控偽造大S簽名貸款4900萬買房,本人回應(yīng)!

娛圈小愚
2025-05-30 11:32:36
黃楊鈿甜父親是1987年的!早期豪宅大曝光,姚安娜是資本家乖孩子

黃楊鈿甜父親是1987年的!早期豪宅大曝光,姚安娜是資本家乖孩子

吃瓜少女張小暖
2025-05-27 22:12:08
中國貿(mào)促會答每經(jīng)問:中美關(guān)系基礎(chǔ)在民間,將搭建更多中國同美國以及全球工商界溝通交流的平臺

中國貿(mào)促會答每經(jīng)問:中美關(guān)系基礎(chǔ)在民間,將搭建更多中國同美國以及全球工商界溝通交流的平臺

每日經(jīng)濟(jì)新聞
2025-05-30 16:30:08
體檢報告出現(xiàn)5個詞,二甲雙胍必須停,很多人第一條都中招!

體檢報告出現(xiàn)5個詞,二甲雙胍必須停,很多人第一條都中招!

界史
2025-05-30 14:32:34
金正恩主持軍事會議并觀摩炮兵射擊比賽

金正恩主持軍事會議并觀摩炮兵射擊比賽

海外網(wǎng)
2025-05-30 11:40:03
剛給美送千億大單,沙特突然找上中國,外交部宣布重磅消息

剛給美送千億大單,沙特突然找上中國,外交部宣布重磅消息

擲低有聲
2025-05-30 01:45:03
確認(rèn)了!即將影響福州!就在今天下午

確認(rèn)了!即將影響福州!就在今天下午

福州晚報
2025-05-30 14:18:44
2025-05-30 17:19:00
每日經(jīng)濟(jì)新聞 incentive-icons
每日經(jīng)濟(jì)新聞
中國主流財經(jīng)全媒體平臺。
1254879文章數(shù) 2714196關(guān)注度
往期回顧 全部

科技要聞

榮耀新CEO放話:下半年重返前三,靠譜嗎?

頭條要聞

銷量承壓下寶馬重回"價格戰(zhàn)" 5系裸車價最低跌至26萬

頭條要聞

銷量承壓下寶馬重回"價格戰(zhàn)" 5系裸車價最低跌至26萬

體育要聞

當(dāng)我終于回國時,可能已認(rèn)不出我的家

娛樂要聞

趙麗穎新劇撲街?演技扛劇能力遭質(zhì)疑

財經(jīng)要聞

美國政府殺瘋了,全世界目瞪口呆

汽車要聞

可城能野更智能 猛士M817把硬派SUV玩出花

態(tài)度原創(chuàng)

親子
手機(jī)
旅游
本地
公開課

親子要聞

9個月大中美混血萌娃這舞蹈天賦了得,聽到音樂就開始跳了,真嗨

手機(jī)要聞

華為Pura 80系列即將官宣 博主:視頻拍攝強(qiáng)得可怕

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 星座| 泸西县| 湘乡市| 青铜峡市| 炎陵县| 彩票| 临海市| 巴楚县| 岱山县| 蕉岭县| 开平市| 绥宁县| 义马市| 定南县| 商城县| 朝阳县| 阿拉善盟| 繁峙县| 牙克石市| 凤城市| 文水县| 和硕县| 普定县| 原阳县| 凤台县| 宁河县| 门源| 黄平县| 黄山市| 麻江县| 巩义市| 密山市| 温泉县| 宁国市| 高清| 西充县| 苍山县| 交口县| 武冈市| 涞源县| 遂川县|