99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek節(jié)前又雙叒叕搞事,R1“小版本試更新”代碼能力實測堪比Claude 4

0
分享至

作者|沐風(fēng)

來源|AI先鋒官

臨近端午假期,DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級,歡迎前往官方網(wǎng)頁、App、小程序測試(打開深度思考),API接口和使用方式保持不變。


果然符合DeepSeek的作風(fēng),節(jié)前搞事。

緊接著,在今天凌晨,官方又在HuggingFace上開源了DeepSeek-R1-0528。


開源地址:

https://huggingface.co/DeepSeek-ai/DeepSeek-R1-0528/tree/main

不過,DeepSeek官方此次并沒有公布版本更新的具體內(nèi)容。

有消息稱,該模型是基于DeepSeek-V3-0324訓(xùn)練(參數(shù)為660B)。

據(jù)眾多開發(fā)者測試發(fā)現(xiàn),DeepSeek-R1-0528目前提升最為明顯的也是代碼能力。

在代碼測試平臺Live CodeBench中,其性能幾乎媲美OpenAI的o3-high和o4-mini(Medium)超越了Gemini 2.5 Flash。


AI博主同時也是KCORES開源硬件項目聯(lián)合創(chuàng)始人“karminski-牙醫(yī)”使用DeepSeek-R1-0528和Claude-4-Sonnet進行了對比測試。


在Prompt相同,且一次性生成的情況下, Claude-4-Sonnet生成了542行, DeepSeek-R1-0528生成了728行。

從平面的橙色漫反射、控制面板的美觀程度、撞擊后的運動方向等效果上看,DeepSeek-R1-0528更加出色。

另外,根據(jù)其他網(wǎng)友的測試結(jié)果顯示,DeepSeek-R1-0528在前端設(shè)計的審美、編碼能力上也已經(jīng)達到了Claude 4 Sonnet水準。

例如:




大家可以自行對比。

X博主Haider.更是直接稱贊到“這是我在這個任務(wù)上測試過的最好的模型”,他讓DeepSeek-R1-0528構(gòu)建一個單詞評分系統(tǒng)。


DeepSeek-R1-0528簡要思考后,一次性生成兩個文件,一個是主程序,一個是測試腳本,代碼結(jié)構(gòu)清晰,邏輯閉環(huán),首次運行就順利通過,沒有報錯。

該博主稱,此前,o3是唯一能完成這個任務(wù)的模型,DeepSeek-R1-0528是第二個,堪稱是完成這個任務(wù)的最佳型。

不過,DeepSeek-R1-0528在編程能力的全面性上還是有一點點不足。

例如,缺少多模態(tài)能力,它不能像Claud那樣通過截圖來描述代碼錯誤,調(diào)試比較麻煩。

但即便如此,它在代碼生成方面已經(jīng)穩(wěn)穩(wěn)站在了Claude 3.7和Claude 4之間的水平。

另外,它的進步也遠不止于代碼能力。

“karminski-牙醫(yī)”還對其進行了文本召回測試。


發(fā)現(xiàn)DeepSeek-R1-0528在上下文32K以內(nèi)比之前的R1模型要好不少,但是在60K的上下文中效果下降了不少。

這意味著在32K以內(nèi)針對給定的材料向DeepSeek-R1-0528提問問題,它回答的準確度會更好。

同時,也有開發(fā)者總結(jié)此次更新的另外幾個亮點:

·能像Google模型一樣深度推理文本生成優(yōu)化;

·寫作任務(wù),更自然、格式更好;

·不僅僅是快速,而且深思熟慮;

·單任務(wù)處理時長可達30-60分鐘。


不過,最具爭議的一點是,思考時間更長,有網(wǎng)友實測后,R1思考時長超過了25分鐘。

有網(wǎng)友認為,它的思考過程之所以很長,是為了彌補推理能力,導(dǎo)致響應(yīng)速度比較慢。

但也有網(wǎng)友認為,長思考可以讓它給出的答案更加準確。

例如,有網(wǎng)友提到,DeepSeek-R1-0528是目前唯一一個能穩(wěn)定正確回答“9.9-9.11 等于多少?”的模型。


雖然官方稱此次R1是“小版本試升級”,但在網(wǎng)友看來卻是一次實打?qū)嵉恼嫔墶?/p>

許多網(wǎng)友不禁讓感嘆,如果這是R1,那么R2會有多好?

但此次DeepSeek-R1-0528的發(fā)布也意味著R2恐怕還得再等等。

DeepSeek該不會覺得只要不是模型架構(gòu)更新,只是能力變強就不算大版本升級?

掃碼邀請進群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。

往期文章回顧



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
以色列懸著的心終于死了,伊朗連續(xù)五輪導(dǎo)彈雨洗地,美軍被拉下水

以色列懸著的心終于死了,伊朗連續(xù)五輪導(dǎo)彈雨洗地,美軍被拉下水

文雅筆墨
2025-06-14 12:31:21
江西一女刑犯在獄中懷孕,獄警調(diào)查3天后,卻在女人堆里找出奸夫

江西一女刑犯在獄中懷孕,獄警調(diào)查3天后,卻在女人堆里找出奸夫

懸案解密檔案
2025-06-13 10:26:24
繼盧比奧之后,濃眉大眼的凱洛格也叛變了!

繼盧比奧之后,濃眉大眼的凱洛格也叛變了!

聽風(fēng)聽你
2025-06-13 20:01:10
北京老太癡呆30年,突然想起在地窖囤有茅臺,專家鑒定后倒吸涼氣

北京老太癡呆30年,突然想起在地窖囤有茅臺,專家鑒定后倒吸涼氣

秋風(fēng)專欄
2025-05-21 15:18:45
62歲何賽飛現(xiàn)狀:住杭州別墅區(qū),學(xué)騎電車接地氣,與老公感情穩(wěn)定

62歲何賽飛現(xiàn)狀:住杭州別墅區(qū),學(xué)騎電車接地氣,與老公感情穩(wěn)定

墨印齋
2025-06-14 19:15:56
國家自然科學(xué)基金委員會:嚴正聲明!

國家自然科學(xué)基金委員會:嚴正聲明!

高分子材料科學(xué)
2025-06-13 20:32:04
伊朗系全面反擊?胡塞武裝終于參戰(zhàn)了!伊朗放狠話:要打美軍基地

伊朗系全面反擊?胡塞武裝終于參戰(zhàn)了!伊朗放狠話:要打美軍基地

梁訊
2025-06-14 19:54:14
雞蛋再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):吃雞蛋時,務(wù)必多留意這幾點

雞蛋再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):吃雞蛋時,務(wù)必多留意這幾點

DrX說
2025-05-21 12:47:30
002384,重大收購!存儲器巨頭官宣大動作,投資擴大至1500億美元

002384,重大收購!存儲器巨頭官宣大動作,投資擴大至1500億美元

數(shù)據(jù)寶
2025-06-14 13:03:16
震驚!大量外籍演員演中國劇,觀眾怒吼:我們的演員哪去了?

震驚!大量外籍演員演中國劇,觀眾怒吼:我們的演員哪去了?

深析古今
2025-06-11 22:45:22
車曉43歲生日,在家請朋友吃麻醬拌面和剩菜,沒洗手抓菜被吐槽

車曉43歲生日,在家請朋友吃麻醬拌面和剩菜,沒洗手抓菜被吐槽

鄭丁嘉話
2025-06-14 10:37:29
爆冷!鄭欽文2-0橫掃,升至世界第4,將在溫網(wǎng)避開薩巴倫卡

爆冷!鄭欽文2-0橫掃,升至世界第4,將在溫網(wǎng)避開薩巴倫卡

體育就你秀
2025-06-14 07:16:43
小楊阿姨帶玥兒霖霖吃壽司自助!姥姥給馬筱梅發(fā)短信照看孩子!

小楊阿姨帶玥兒霖霖吃壽司自助!姥姥給馬筱梅發(fā)短信照看孩子!

鄭丁嘉話
2025-06-14 09:17:23
好消息:中國防空導(dǎo)彈再次擊落戰(zhàn)機!壞消息:被擊落的是中國戰(zhàn)機

好消息:中國防空導(dǎo)彈再次擊落戰(zhàn)機!壞消息:被擊落的是中國戰(zhàn)機

荷蘭豆愛健康
2025-06-12 18:47:39
以色列政府專機飛抵希臘,為躲避伊朗報復(fù)行動,去年伊朗襲擊期間該機也曾從空軍基地起飛

以色列政府專機飛抵希臘,為躲避伊朗報復(fù)行動,去年伊朗襲擊期間該機也曾從空軍基地起飛

魯中晨報
2025-06-14 09:38:03
七年前,那個走4.5公里山路上學(xué),滿頭冰花的男孩,后來怎樣了?

七年前,那個走4.5公里山路上學(xué),滿頭冰花的男孩,后來怎樣了?

青眼財經(jīng)
2025-06-14 14:10:45
上騙中央,下騙百姓,三回入獄,從首富到首騙,把他吹的太神了!

上騙中央,下騙百姓,三回入獄,從首富到首騙,把他吹的太神了!

妙知
2025-06-14 17:27:35
公司稱正核實“多所高校禁用羅馬仕兩萬毫安充電寶” 專家:預(yù)防手機沒電選中等體積產(chǎn)品即可

公司稱正核實“多所高校禁用羅馬仕兩萬毫安充電寶” 專家:預(yù)防手機沒電選中等體積產(chǎn)品即可

紅星新聞
2025-06-14 15:13:11
0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

墨印齋
2025-05-29 14:46:17
俄刀終于捅進了烏克蘭心臟

俄刀終于捅進了烏克蘭心臟

那山星火
2025-06-11 06:22:47
2025-06-14 21:35:00
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應(yīng)用精選與評測
295文章數(shù) 18關(guān)注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

頭條要聞

特朗普79歲生日當天 全美50州預(yù)計將舉行2000場抗議

頭條要聞

特朗普79歲生日當天 全美50州預(yù)計將舉行2000場抗議

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

陳小春演唱會賣力唱跳 57歲仍活力滿滿

財經(jīng)要聞

樓市權(quán)威發(fā)聲

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

旅游
健康
手機
本地
軍事航空

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言!

手機要聞

OPPO K13 Turbo Pro被確認:144Hz直屏+主動散熱風(fēng)扇,變頻也有了

本地新聞

最近的打工人,都在熬夜看這劇逐幀學(xué)習(xí)職場小技巧

軍事要聞

伊媒:以色列國防部大樓被伊朗導(dǎo)彈擊中

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 洞口县| 玉田县| 广西| 邹平县| 正宁县| 南木林县| 和田市| 饶河县| 小金县| 屏东县| 汉川市| 屯昌县| 大安市| 普安县| 白水县| 广元市| 潮安县| 金阳县| 潼南县| 门头沟区| 喀什市| 吉首市| 顺义区| 武宁县| 区。| 鹤峰县| 武冈市| 伊通| 名山县| 周至县| 保靖县| 江北区| 福州市| 宣威市| 青神县| 彭阳县| 白玉县| 苗栗市| 灯塔市| 吉安市| 井冈山市|