99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里 Qwen3 令人失望?

0
分享至



大家好,我是 Ai 學習的老章

極簡結論:Qwen3 是可以本地部署的最強開源寫代碼大模型

我只有 4 張 4090 顯卡,本文嘗試本地部署 Qwen3:32B,搭配 OpenwebUI 聊天 Bot,簡單看看其推理速度

  • 本地部署

  • Mac 部署

  • 下載模型

  • 模型部署

  • openwebui 聊天助手

  • 測試

本地部署可選方案 ollama

模型頁:https://ollama.com/library/qwen3

運行:ollama run qwen3

其他尺寸,在后面加參數即可,比如:ollama run qwen3:32b

可以在提示詞后輸入 /no_think 來切換 Ollama 中的無思考模式。

備注??:ollama 運行的是量化版,效果有折扣

vLLM

需要升級到 v0.8.4 以上,最好 v0.8.5

地址:https://github.com/vllm-project/vllm/issues/17327

vllm serve Qwen/Qwen3-235B-A22B-FP8 --enable-reasoning --reasoning-parser deepseek_r1 --tensor-parallel-size 4
SGLang

需要升級到SGLang 0.4.6.post1

地址:https://github.com/sgl-project/sglang

pip3 install "sglang[all]>=0.4.6.post1" python3 -m sglang.launch_server --model Qwen/Qwen3-235B-A22B --tp 8 --reasoning-parser qwen3 python3 -m sglang.launch_server --model Qwen/Qwen3-235B-A22B-FP8 --tp 4 --reasoning-parser qwen3
CPU 部署 llama.cpp

可以用 llama.cpp 運行起 Qwen3 量化版本、動態量化版本!

地址:https://huggingface.co/collections/unsloth/qwen3-680edabfb790c8c34a242f95


KTransformer

Xeon 鉑金 4 代 + 4090 運行 Qwen3-235B-A22B 單個請求可以達到 13.8 token/s, 4 個請求并行可以達到總計 24.4 token/s

地址:http://github.com/kvcache-ai/ktransformers/blob/main/doc/en/AMX.md

Mac 部署

Mac 上也可以跑 Qwen3 了

地址:https://github.com/ml-explore/mlx-lm/commit/5c2c18d6a3ea5f62c5b6ae7dda5cd9db9e8dab16

pip install -U mlx-lm # or conda install -c conda-forge mlx-lm

支持設備

  • iPhone: 0.6B, 4B

  • Macbook: 8B, 30B, 3B/30B MoE

  • M2, M3 Ultra: 22B/235B MoE

有網友測試Qwen3-235B-A22B-4bit量化版本在 Apple Mac Studio M2 Ultra 能跑到 28 toks/sec,大概占用 132GB 內存

下載模型

模型文件:https://modelscope.cn/models/Qwen/Qwen3-32B/files


在下載前,先通過如下命令安裝 ModelScope

pip install modelscope

命令行下載完整模型庫

modelscope download --model Qwen/Qwen3-32B

下載單個文件到指定本地文件夾(以下載 README.md 到當前路徑下“dir”目錄為例)

modelscope download --model Qwen/Qwen3-32B README.md --local_dir ./dir

模型大小約 64GB


模型部署

用 vllm 拉起大模型,我有 4 張 4090 顯卡,tensor-parallel-size 設置為 4

pip install --upgrade vllm vllm serve . --served-model-name Qwen3:32B --port 3001 --enble-reasoning --reasoning-parse deepseek_r1 --tensor-parallel-size 4

卡沒被占滿,還有空余拉起 reranker 模型


openwebui 聊天助手

OpenWebUI 旨在為 AI 和 LLMs 構建最佳用戶界面,為那些互聯網訪問受限的人提供利用 AI 技術的機會。OpenWebUI 通過 Web 界面本地運行 LLMs,使 AI 和 LLMs 更安全、更私密。

安裝 openwebui 是我見過所有 chatbot 中最簡單的了

# 安裝 pip install open-webui # 啟動 open-webui serve

瀏覽器打開 http://locahost:8080

如果是服務器部署,把 localhost 改為服務器 ip

正常注冊登陸


右上角點擊頭像,點擊管理員面板

點擊設置 - 外部鏈接,照著抄一下,api key 隨便填寫

然后回到前端,左上角添加模型那里就可以找到 Qwen3:32B 了

teminal 頁面會實時輸出模型推理時的性能


速度還蠻快的,如果開啟 reasoning 會慢很多,關閉的話,vllm 那里改成下面即可

vllm serve . --served-model-name Qwen3:32B --port 3001 --tensor-parallel-size 4

測試

我看了xhs上一些網友評價,很多說效果遠遠不如官方公布的結果,還有說幻覺嚴重


有些是直接用 ollama 運行的量化版,效果不好很正常

有些是在官方網站上測試的,這個就見仁見智了,我還是覺得個例的參考價值不大

用腦經急轉彎和弱智吧的問題去測試大模型,屬實腦經不轉彎。

看兩個獨立測評

evalscope 做了測試,結果 - Qwen3-32B 模型在思考模式下,其準確率與 QwQ-32B 相當(在 Accuracy 折線上兩者重合),都達到了最好的水平。隨著問題難度的增加,模型的輸出長度都隨問題難度增加而增加,這表明模型在解答更復雜問題時需要更長的"思考時間",與 Inference-Time Scaling 現象相符。


推上 karminski3 測試了其寫代碼能力

極簡結論:Qwen3 是可以本地部署的最強開源寫代碼大模型


制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
大反轉?寧波交警注銷短視頻賬號,為保時捷周少爺辟謠,惹爭議

大反轉?寧波交警注銷短視頻賬號,為保時捷周少爺辟謠,惹爭議

坦然風云
2025-05-08 09:24:19
17歲森碟在北京合生匯被偶遇,純素顏買倉鼠,下巴矯正后好漂亮

17歲森碟在北京合生匯被偶遇,純素顏買倉鼠,下巴矯正后好漂亮

漣漪讀史
2025-05-08 14:10:51
景甜怎么胖成這樣了?但肉肉的更清純更像女大學生了

景甜怎么胖成這樣了?但肉肉的更清純更像女大學生了

可樂談情感
2025-05-07 16:30:56
烏軍空襲莫斯科庫賓卡機場!是勝利日俄空軍表演隊的基地

烏軍空襲莫斯科庫賓卡機場!是勝利日俄空軍表演隊的基地

項鵬飛
2025-05-07 19:39:23
李寧教科級翻臉!全紅嬋徹底破防了!陳芋汐也很尷尬

李寧教科級翻臉!全紅嬋徹底破防了!陳芋汐也很尷尬

西樓知趣雜談
2025-05-08 12:47:10
女子長期住橋洞不上班,靠男生投喂和撿廢品為生:白長那么好看

女子長期住橋洞不上班,靠男生投喂和撿廢品為生:白長那么好看

唐小糖說情感
2025-05-08 09:23:12
這次真不是水炮了!菲軍艦強闖黃巖島,中國兩艘054A直接沖鋒!

這次真不是水炮了!菲軍艦強闖黃巖島,中國兩艘054A直接沖鋒!

大道無形我有型
2025-05-08 12:20:53
51歲鐘漢良醫美后遺癥嚴重!撞臉林瑞陽,臉部腫脹饅化似老奶奶

51歲鐘漢良醫美后遺癥嚴重!撞臉林瑞陽,臉部腫脹饅化似老奶奶

八星人
2025-05-08 14:07:02
外交部:堅定支持埃及政府和人民捍衛主權和正當權益,反對任何的霸凌言行

外交部:堅定支持埃及政府和人民捍衛主權和正當權益,反對任何的霸凌言行

環球網資訊
2025-05-07 15:43:39
教育局通報:情況屬實,教師休假離崗,校長被免職!

教育局通報:情況屬實,教師休假離崗,校長被免職!

大愛三湘
2025-05-08 20:16:22
“征服”一個中年女人,不要送禮物,也不要打電話,而是這樣做

“征服”一個中年女人,不要送禮物,也不要打電話,而是這樣做

蓮子說情感
2025-05-04 10:06:26
馬斯克透露一個所有人都應感到恐懼的可怕預測:地球上所有的生命都將被太陽摧毀

馬斯克透露一個所有人都應感到恐懼的可怕預測:地球上所有的生命都將被太陽摧毀

林子說事
2025-05-07 03:04:07
涉嫌嚴重職務違法,廣西一縣政協副主席主動投案!

涉嫌嚴重職務違法,廣西一縣政協副主席主動投案!

瀟湘晨報
2025-05-08 14:43:10
字母哥有機會加盟湖人!6換1交易方案出爐,湖人或組三巨頭再沖冠

字母哥有機會加盟湖人!6換1交易方案出爐,湖人或組三巨頭再沖冠

老梁體育漫談
2025-05-09 00:10:53
主持人李彬:與病魔抗爭8年,人走茶不涼,只是容貌大變讓人心疼

主持人李彬:與病魔抗爭8年,人走茶不涼,只是容貌大變讓人心疼

墨印齋
2025-05-07 11:55:02
港人北上逼爆深圳!內地網民批港人3大恐怖劣行

港人北上逼爆深圳!內地網民批港人3大恐怖劣行

熱鬧吃瓜大姐
2025-05-07 16:40:20
人民日報怒批!戳穿了胖東來“屢犯”的真相,于東來刪除邀請視頻

人民日報怒批!戳穿了胖東來“屢犯”的真相,于東來刪除邀請視頻

削桐作琴
2025-05-08 19:12:42
暴跌,跌回“6元時代”?時間定了,馬上要變

暴跌,跌回“6元時代”?時間定了,馬上要變

浙江之聲
2025-05-08 11:11:14
明道在上海,騎3000元自行車送娃上學,兒子站后座摟著他好危險

明道在上海,騎3000元自行車送娃上學,兒子站后座摟著他好危險

八怪娛
2025-05-08 16:38:34
法媒:如果巴黎在歐冠決賽擊敗國米,米蘭球迷將原諒多納魯馬

法媒:如果巴黎在歐冠決賽擊敗國米,米蘭球迷將原諒多納魯馬

懂球帝
2025-05-08 15:25:37
2025-05-09 00:40:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
2949文章數 11008關注度
往期回顧 全部

科技要聞

理想L煥新版來了,輔助駕駛芯片全系升級

頭條要聞

美財長:特朗普考慮豁免部分商品最高145%關稅

頭條要聞

美財長:特朗普考慮豁免部分商品最高145%關稅

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

劉畊宏老婆補刀 清場風波口碑翻車!

財經要聞

57政策解讀:力度空前的系統性穩增長舉措

汽車要聞

昨天李想點評了AI 今天我讓AI點評了理想

態度原創

藝術
游戲
親子
公開課
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

新《戰地》中國區注冊開啟 注冊流程公開

親子要聞

孩子舌苔厚口臭家長別著急,中醫教您一個穴位推拿方法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

山東艦航母現身菲北部海域 國防部回應

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 都兰县| 宜宾县| 平果县| 荥经县| 伽师县| 铁力市| 大丰市| 理塘县| 舟山市| 台北县| 巴林右旗| 蓝山县| 玉溪市| 洛隆县| 玛纳斯县| 河间市| 福州市| 余干县| 东平县| 宜黄县| 富川| 哈巴河县| 广汉市| 河东区| 尼勒克县| 洪江市| 乡宁县| 澎湖县| 青海省| 青河县| 丹寨县| 汉川市| 枞阳县| 商都县| 基隆市| 纳雍县| 潍坊市| 民丰县| 江山市| 德州市| 广宗县|