99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-R1-0528 蒸餾 Qwen3:8B大模型,雙 4090本地部署,深得我心

0
分享至


大家好,我是 Ai 學習的老章

DeepSeek-R1-0528 很強

但,即便是量化版本地部署起來也成本巨高

我還是關心 DeepSeek 同步開源的一個小型——DeepSeek-R1-0528-Qwen3-8B

看看其能否低成本地替換某些工作流中的 Qwen3:32B

本文,我用2張 4090 顯卡部署它,然后和 4 卡運行起來的 Qwen3:32B 做個對比


DeepSeek-R1-0528-Qwen3-8B

這個模型是從 DeepSeek-R1-0528 的思維鏈蒸餾出來用于后訓練 Qwen3 8B Base 而得。

通過蒸餾技術,在 AIME 2024 上達到 86.0,超越 Qwen3-8B (+10%),媲美更大模型!

DeepSeek-R1-0528-Qwen3-8B在 2024 年美國數學邀請賽(AIME)上的開源模型中取得了最先進(SOTA)的性能,比 Qwen3 8B 提高了 10.0%,性能與 Qwen3-235B-thinking 相當。

AIME 24

AIME 25

HMMT Feb 25

GPQA Diamond

LiveCodeBench (2408-2505)

Qwen3-235B-A22B

85.7

81.5

62.5

71.1

66.5

Qwen3-32B

81.4

72.9

68.4

Qwen3-8B

76.0

67.3

62.0

Gemini-2.5-Flash-Thinking-0520

82.3

72.0

64.2

82.8

62.3

o3-mini (medium)

79.6

76.7

53.3

76.8

65.9

DeepSeek-R1-0528-Qwen3-8B86.076.361.561.160.5
下載模型

模型文件:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B/files


在下載前,先通過如下命令安裝 ModelScope

pip install modelscope

命令行下載完整模型庫

modelscope download --model deepseek-ai/DeepSeek-R1-0528-Qwen3-8B --local_dir .

模型大小約 16GB

部署

看介紹,它的模型架構與 Qwen3-8B 完全相同,只是與 DeepSeek-R1-0528 共享相同的分詞器配置,所以,部署的話與 Qwen3-8B 沒啥區別。

用 vllm 拉起大模型

pip install --upgrade vllm
CUDA——VIDIBLE_DEVICES=4 vllm serve . --served-model-name R1-0528-Qwen3-8B 3002 

默認參數的 max_model_len 是 131072,需要 18GB 的 KVcache 空間

4090 只有 24G,不夠用


要想拉起來,要么降低 max_model_len,要么兩張 4090

我選擇后者

pip install --upgrade vllm
CUDA_VIDIBLE_DEVICES=4,5 vllm serve . --served-model-name R1-0528-Qwen3-8B 3002  --tensor-parallel-size 2
openwebui 聊天助手

測試窗口,我是用 openwebui

OpenWebUI 旨在為 AI 和 LLMs 構建最佳用戶界面,為那些互聯網訪問受限的人提供利用 AI 技術的機會。OpenWebUI 通過 Web 界面本地運行 LLMs,使 AI 和 LLMs 更安全、更私密。

安裝 openwebui 是我見過所有 chatbot 中最簡單的了

# 安裝
pip install open-webui
 # 啟動
open-webui serve

瀏覽器打開 http://locahost:8080

如果是服務器部署,把 localhost 改為服務器 ip

正常注冊登陸


右上角點擊頭像,點擊管理員面板

點擊設置 - 外部鏈接,照著抄一下,api key 隨便填寫


然后回到前端,左上角添加模型那里就可以找到 R1-0528-Qwen3-8B 了


teminal 頁面會實時輸出模型推理時的性能

推理速度可以做到 90Tokens/s

Qwen3:32B 之前我介紹過(),40Tokens/s的樣子


具體測試我需要后續再寫了,有點忙,先看幾個簡單問題的對比:


我覺得DeepSeek-R1-0528-Qwen3-8B的自我介紹非常棒

作為對比,大家可以看看我之前這篇文章:

問題2:用html寫一個黑客帝國數字雨


DeepSeek-R1-0528-Qwen3-8B努力地嘗試設計更多功能,比如滴答聲效、閃爍效果、鍵盤控制和交互功能,但是,運行有bug?

Qwen3:32B,老是本分,簡單生成了數字/字母雨效果,運行正常?

問題3:總結DeepSeek-R1-0528這篇文論


感覺上DeepSeek-R1-0528-Qwen3-8B更好一些,思考的很快(5s vs 18s),結尾還會友情提示是否需要追問某些細節


后續我再認真測試解決bug、知識問答

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技
2025-06-25 16:18:11
63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

TVB的四小花
2025-06-16 02:57:47
杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

秘密清風
2025-06-27 14:01:20
李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

檸檬有娛樂
2025-06-27 10:13:46
追求標準答案危害無窮

追求標準答案危害無窮

水寒說語文
2025-06-26 17:30:16
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

醉臥浮生
2025-06-27 15:48:22
財政部:截至5月末全國地方政府債務余額512475億元

財政部:截至5月末全國地方政府債務余額512475億元

澎湃新聞
2025-06-27 10:36:06
艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

火山詩話
2025-06-26 06:42:34
當年為什么查辦褚時健?

當年為什么查辦褚時健?

顧史
2025-06-09 20:26:22
又一個經濟奇跡——孟加拉國

又一個經濟奇跡——孟加拉國

古老板的老巢
2025-06-24 23:41:45
博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

懂球帝
2025-06-27 08:40:19
洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

嘆知
2025-06-23 10:34:33
中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

Steam社區
2025-06-26 11:57:21
絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

墻頭草
2025-04-01 12:00:11
昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

一盅情懷
2025-06-27 15:54:59
1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

金融界
2025-06-26 23:50:34
塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

東球弟
2025-06-27 12:34:08
笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

深析古今
2025-06-27 17:14:39
萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

史行途
2025-06-27 15:07:11
2025-06-27 21:44:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

本地
健康
房產
公開課
軍事航空

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

呼吸科專家破解呼吸道九大謠言!

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美媒揭美軍37小時奔襲伊朗細節

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 奉新县| 雷波县| 罗定市| 北海市| 涞水县| 和田县| 霍城县| 海安县| 南汇区| 双城市| 虞城县| 丘北县| 南溪县| 丹江口市| 武胜县| 蓝山县| 蒙山县| 南昌市| 岱山县| 犍为县| 平顶山市| 内乡县| 河北省| 石屏县| 博罗县| 邹平县| 砀山县| 历史| 县级市| 交口县| 永靖县| 秦安县| 万州区| 宣城市| 盐亭县| 大城县| 旺苍县| 彩票| 措美县| 合肥市| 贵州省|