大家好,我是 Ai 學(xué)習(xí)的老章
最近工作特別忙,寫個短文
推薦三個我高頻使用的DeepSeek
模型
DeepSeek-R1-0528-Qwen3-8B
這是最新的DeepSeek-R1-0528
思維鏈蒸餾提取后對Qwen3-8B-Base
后訓(xùn)練而來:
這個模型我最喜歡的幾個點:
成本極低,模型文件 16GB,默認(rèn)參數(shù)下,兩張 4090 顯卡順暢運行
性能很強,無論是各種 Bench 上的解釋結(jié)果,還是我個人使用體驗,打參數(shù)和模型文件都 4 倍與其的 Qwen32-B 都沒問題
速度極快,2 張 4090 啟動時,90Tonken/s
目前DeepSeek-R1-0528-Qwen3-8B
我主要用于知識庫意圖識別、問題改寫、問題分類
缺點:無法關(guān)閉思考,我用 vllm 啟動,用在 Dify 中,直接關(guān)閉還是提示詞中加 no_think 都不行
DeepSeek-R1-0528
R1 的小版本升級,但是很明顯,性能和推理能力都加強很多:
這個模型應(yīng)該是 0 成本可以用到的最牛逼的模型了吧
網(wǎng)頁版我倒是用的很少,主要是調(diào) API,主要用在Obsidian
上查資料,翻譯,寫文章
和在Cursor
上寫代碼
缺點:很慢,Cursor
上寫代碼也不支持Agent
模式
DeepSeek-V3-Fast
前段時間發(fā)現(xiàn)的一個小眾版本DeepSeek-V3-Fast
,它是DeepSeek V3 0324
的高 TPS 極速版
API 申清:
https://r2.zhanglearning.com/blog/2025/06/f786f6756cd363d6f0be5220ce65885f.png
最大優(yōu)點就是推理速度,快如閃電??
目前我主要把它用在Obsidian
做總結(jié),還有沉浸式插件中當(dāng)翻譯 (真的快如閃電)
缺點是能力不及 R1,不穩(wěn)定
制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.