網易首頁 > 網易號 > 正文申請入駐

DeepSeek-R1-0528 蒸餾 Qwen3:8B大模型，雙 4090本地部署，深得我心

2025-05-30 15:47:06　來源: 機器學習與Python社區

北京舉報

分享至

大家好，我是 Ai 學習的老章

DeepSeek-R1-0528 很強

但，即便是量化版本地部署起來也成本巨高

我還是關心 DeepSeek 同步開源的一個小型——DeepSeek-R1-0528-Qwen3-8B

看看其能否低成本地替換某些工作流中的 Qwen3:32B

本文，我用2張 4090 顯卡部署它，然后和 4 卡運行起來的 Qwen3:32B 做個對比

DeepSeek-R1-0528-Qwen3-8B

這個模型是從 DeepSeek-R1-0528 的思維鏈蒸餾出來用于后訓練 Qwen3 8B Base 而得。

通過蒸餾技術，在 AIME 2024 上達到 86.0，超越 Qwen3-8B (+10%)，媲美更大模型！

DeepSeek-R1-0528-Qwen3-8B在 2024 年美國數學邀請賽（AIME）上的開源模型中取得了最先進（SOTA）的性能，比 Qwen3 8B 提高了 10.0%，性能與 Qwen3-235B-thinking 相當。

AIME 24

AIME 25

HMMT Feb 25

GPQA Diamond

LiveCodeBench (2408-2505)

Qwen3-235B-A22B

85.7

81.5

62.5

71.1

66.5

Qwen3-32B

81.4

72.9

68.4

Qwen3-8B

76.0

67.3

62.0

Gemini-2.5-Flash-Thinking-0520

82.3

72.0

64.2

82.8

62.3

o3-mini (medium)

79.6

76.7

53.3

76.8

65.9

DeepSeek-R1-0528-Qwen3-8B86.076.361.561.160.5
下載模型

模型文件：https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B/files

在下載前，先通過如下命令安裝 ModelScope

pip install modelscope

命令行下載完整模型庫

modelscope download --model deepseek-ai/DeepSeek-R1-0528-Qwen3-8B --local_dir .

模型大小約 16GB

部署

看介紹，它的模型架構與 Qwen3-8B 完全相同，只是與 DeepSeek-R1-0528 共享相同的分詞器配置，所以，部署的話與 Qwen3-8B 沒啥區別。

用 vllm 拉起大模型

pip install --upgrade vllm
CUDA——VIDIBLE_DEVICES=4 vllm serve . --served-model-name R1-0528-Qwen3-8B 3002

默認參數的 max_model_len 是 131072，需要 18GB 的 KVcache 空間

4090 只有 24G，不夠用

要想拉起來，要么降低 max_model_len，要么兩張 4090

我選擇后者

pip install --upgrade vllm
CUDA_VIDIBLE_DEVICES=4,5 vllm serve . --served-model-name R1-0528-Qwen3-8B 3002  --tensor-parallel-size 2

openwebui 聊天助手

測試窗口，我是用 openwebui

OpenWebUI 旨在為 AI 和 LLMs 構建最佳用戶界面，為那些互聯網訪問受限的人提供利用 AI 技術的機會。OpenWebUI 通過 Web 界面本地運行 LLMs，使 AI 和 LLMs 更安全、更私密。

安裝 openwebui 是我見過所有 chatbot 中最簡單的了

# 安裝
pip install open-webui
 # 啟動
open-webui serve

瀏覽器打開 http://locahost:8080

如果是服務器部署，把 localhost 改為服務器 ip

正常注冊登陸

右上角點擊頭像，點擊管理員面板

點擊設置 - 外部鏈接，照著抄一下，api key 隨便填寫

然后回到前端，左上角添加模型那里就可以找到 R1-0528-Qwen3-8B 了

teminal 頁面會實時輸出模型推理時的性能

推理速度可以做到 90Tokens/s

Qwen3:32B 之前我介紹過（），40Tokens/s的樣子

具體測試我需要后續再寫了，有點忙，先看幾個簡單問題的對比：

我覺得DeepSeek-R1-0528-Qwen3-8B的自我介紹非常棒

作為對比，大家可以看看我之前這篇文章：

問題2:用html寫一個黑客帝國數字雨

DeepSeek-R1-0528-Qwen3-8B努力地嘗試設計更多功能，比如滴答聲效、閃爍效果、鍵盤控制和交互功能，但是，運行有bug?

Qwen3:32B，老是本分，簡單生成了數字/字母雨效果，運行正常?

問題3:總結DeepSeek-R1-0528這篇文論

感覺上DeepSeek-R1-0528-Qwen3-8B更好一些，思考的很快（5s vs 18s），結尾還會友情提示是否需要追問某些細節

后續我再認真測試解決bug、知識問答

制作不易，如果這篇文章覺得對你有用，可否點個關注。給我個三連擊：點贊、轉發和在看。若可以再給我加個，謝謝你看我的文章，我們下篇再見！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

2025年中超上海主場VS大連，球場管理員不讓球迷站著看賽

中安在線 2025-06-27 11:59:28
683 跟貼 683
盧宇光在庫爾斯克被無人機擊中，正在搶救

小A看世界 2025-06-27 00:59:10
44836 跟貼 44836

河北網紅公司1.1億元深圳“搶樓”后悔拍，業內認為“成交總價過高”，有何隱情？

每日經濟新聞 2025-06-27 08:19:13
3399 跟貼 3399

熱搜第一！大學生熱得在樓道、操場打地鋪，東北多所高校回應無空調

大風新聞 2025-06-27 14:03:06
254 跟貼 254
上海官宣：后天出梅！下周或現39~40℃酷熱，開啟“鐵板燒”模式

魯中晨報 2025-06-27 15:16:13
84 跟貼 84

苗華被免去中央軍事委員會委員職務

新京報 2025-06-27 15:32:11
0 跟貼 0

手指粗的螺紋鋼一掰就斷？工人發視頻曝光樓盤鋼筋問題，當地通報：情況不實

極目新聞 2025-06-27 00:30:46
2799 跟貼 2799
路中間正安裝漂亮的新護欄男子飆“國粹”：每年都在換

火煉樹 2025-06-27 17:18:52
4322 跟貼 4322

深圳市酒協呼吁酒廠主動減速降價丨封面觀酒

封面新聞 2025-06-27 17:59:05
23 跟貼 23
加沙15歲男孩餓到只剩18公斤醫院營養補劑已枯竭

大象新聞 2025-06-27 12:23:07
5319 跟貼 5319
歐爾班：匈牙利不支持烏克蘭加入歐盟

環球網資訊 2025-06-26 22:09:49
5154 跟貼 5154
伊朗外長：以色列目前擁有90枚核彈頭，除以之外中東其他國家沒有一個擁核；外界估計以色列掌握核武器介于90-200枚之間

揚子晚報 2025-06-27 08:08:24
1 跟貼 1
澎湃回聲丨“逐本”多款產品被曝成分與備案不符：企業致歉并整改

澎湃新聞 2025-06-27 17:12:29
83 跟貼 83
男生高考696分收到清北“橄欖枝”：清華先找到我，北大晚了一步

星視頻 2025-06-27 14:16:59
73 跟貼 73
全程37小時、美軍內部吹噓……美媒揭美軍奔襲伊朗轟炸核設施任務細節

環球網資訊 2025-06-27 06:44:06
1 跟貼 1
突破3萬億港元香港GDP連升9季

南方都市報 2025-06-27 07:04:49
71 跟貼 71
1-5月國有企業利潤總額16514億元同比下降2.8%

界面新聞 2025-06-27 15:54:58
36 跟貼 36
反不正當競爭法完成修訂

新華社 2025-06-27 09:16:16
311 跟貼 311
1棵樹采購價近80萬！福州煙臺山公園“天價樹”調查：已有多棵死亡

揚子晚報 2025-06-27 10:38:28
0 跟貼 0
“成筐的充電寶被攔”！有機場已經提前執行新規定

上觀新聞 2025-06-27 07:34:08
1 跟貼 1
上海一小區電梯頻頻失重急墜，原因“甩鍋”黃梅天？

瀟湘晨報 2025-06-27 21:19:24
0 跟貼 0
最新回應：雙方暫時分開，獨家畫面公布↗

看看新聞Knews 2025-06-27 21:13:17
0 跟貼 0
相機鋰電池無3C標識不能過檢？北京上海機場：相機電池要求不變

新京報 2025-06-27 13:43:41
0 跟貼 0
五臺山和尚扔掉老人供奉大米，在佛殿里滿嘴臟話：這種米我們有的是

小蘿卜絲 2025-06-27 10:52:06
0 跟貼 0
世界頂級數學家張益唐回國全職加盟中山大學

南方都市報 2025-06-27 19:05:13
0 跟貼 0

你上下行速度多少！工信部：1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技

2025-06-25 16:18:11

63歲吳鎮宇新造型太棒了，沒有老人味還越來越年輕，至少年輕20歲

TVB的四小花

2025-06-16 02:57:47

杜蘭特攜手威少加盟火箭，掘金甩約基奇，火箭重組沖冠局

秘密清風

2025-06-27 14:01:20

李湘和16歲女兒回國，直奔商場買鞋買衣服，王詩齡不化妝很清純

檸檬有娛樂

2025-06-27 10:13:46

追求標準答案危害無窮

水寒說語文

2025-06-26 17:30:16

黃一鳴自曝：王思聰每次約她，車費都給10萬，來給5萬，回再給5萬

漢史趣聞

2025-06-24 10:07:59

楊瀚森自評現役模板：同為16順位申京吃煎餅調侃和周琦夢幻聯動

醉臥浮生

2025-06-27 15:48:22

財政部：截至5月末全國地方政府債務余額512475億元

澎湃新聞

2025-06-27 10:36:06

艱難抉擇！湖北一高二考生被屏蔽，走還是不走？家長和學校犯難了

火山詩話

2025-06-26 06:42:34

當年為什么查辦褚時健？

顧史

2025-06-09 20:26:22

又一個經濟奇跡——孟加拉國

古老板的老巢

2025-06-24 23:41:45

博伊爾斯女友社媒曬照慶祝男友被猛龍選中：哦嘿呀

懂球帝

2025-06-27 08:40:19

洪森惱羞成怒，竟曝光英拉秘事，佩通坦絕地反擊，泰專機直飛中國

嘆知

2025-06-23 10:34:33

中國游戲超越日本！來自日本玩家の認可！IGN日本高度評價《歸唐》！甘肅文旅廳宣布支持開發組古跡掃描

Steam社區

2025-06-26 11:57:21

絕了！碘伏才是隱藏的省錢刺客！我居然白白燒了五年冤枉錢！

墻頭草

2025-04-01 12:00:11

昔日女神成方圓老了！兩段婚姻失敗無子女，對愛失望選擇單身

一盅情懷

2025-06-27 15:54:59

1小時賣了578億！小米YU7大定28.9萬輛遠超SU7，小米ADR暴漲12%，雷軍連喊三個“安全”

金融界

2025-06-26 23:50:34

塵埃落定，重返巴薩？內馬爾官宣，1年合同，年薪1500萬

東球弟

2025-06-27 12:34:08

笑暈！江蘇衛視又逮著常州一個勁嚯嚯！這回“遭殃”的你卻想不到

深析古今

2025-06-27 17:14:39

萬萬沒想到！拒給馬筱梅做婚紗，緬懷大S的蘭玉，竟是他的前女友

史行途

2025-06-27 15:07:11

手機 / 數碼

房產 / 家居

DeepSeek-R1-0528 蒸餾 Qwen3:8B大模型，雙 4090本地部署，深得我心

雷軍：小米汽車成功沒靠營銷，靠的是能力

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

曼城“庫里”連線，送尤文晚安好夢

炸裂！榜一大姐深夜怒錘頂流

合新鐵路建設材料以次充好 多家單位被罰

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

被貴妃帶火的“唐代頂流”，如今怎么不火了

呼吸科專家破解呼吸道九大謠言！

最強黑馬殺出！海南這些區域，教育正悄悄崛起！

美媒揭美軍37小時奔襲伊朗細節

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

合新鐵路建設材料以次充好多家單位被罰

配置升級/貴賓座椅全新GL8陸上公務艙售22.99萬