大家好,我是 Ai 學習的老章
V3-0324 非推理模型排第一
昨晚 DeepSeek-V3-0324 發布,今天 https://artificialanalysis.ai/上放出最新大模型智力排名,在非推理模型中,V3 排名第一。
登錄官方網頁https://chat.deepseek.com/、APP、小程序進入對話界面后,關閉深度思考即可體驗。
模型參數與權重
V3-0324 模型權重下載:
Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324 Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
量化版也出來了
蘋果芯片 4bit 版:
https://modelscope.cn/models/mlx-community/DeepSeek-V3-0324-4bit
unsloth 不同量化精度都正在上傳:https://huggingface.co/unsloth/DeepSeek-V3-0324-GGUF
網絡不通的同學可以蹲一波 modelscope,目前(3 月 25 日 13:40)還沒同步https://modelscope.cn/models/unsloth/DeepSeek-V3-0324
額外說個事兒,市面上有文章說 V3-0324 模型參數是 6850 億,真不是知道這數據哪來的?
怕不是把權重文件的大小當成參數大小了吧???
大家看東西,還是要注意信息源。
DeepSeek 官網寫的很清楚:模型參數約 660B
https://api-docs.deepseek.com/zh-cn/news/news250325
之前我測就感受到這個問題,文心一言效果不理想,就是其引用太多垃圾內容了。
模型測試
大模型測試,還是應該有自己的感受,不同類型任務找到適合的大模型去干。
比如新版 V3 模型,DeepSeek 官方也說了,新版 V3 在數學、代碼類任務上表現優異,甚至超過 GPT-4.5。
關于代碼能力,我讓新 V3 和 Claude-3.7 比拼了一下
prompt:幫我設計一個英語單詞消消樂網頁版游戲
新 V3 設計的是從字母表中找單詞,有點 bug,比如選錯或提交后,再次開始就無法選擇第二個字母。
Claude-3.7 幫我設計的是真消消樂
翻轉卡片找配對的單詞和中文
玩了一下,有點意思!
我又測試了新V3設計和審美,比如制作知識密集的這種卡片或 PPT,感覺新 V3 還是差點意思。
下面四張圖分別是 DeepSeek-V3-0324 和 Claude-3.7 制作的,大家看吧,效果好的就是 Claude-3.7。
DeepSeek-V3-0324
Claude-3.7
英語單詞消消樂,準備部署起來大家一起玩。下期見!
制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.