99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

吃瓜,大模型推理引擎,vLLM和SGLang 杠起來了

0
分享至


大家好,我是 Ai 學習的老章

vLLMSGLang是大模型領域最著名、熱度最高的兩個推理引擎,也都是 DeepSeek 推薦使用的推理引擎。


vLLM 45.3K 星標
項目:https://github.com/vllm-project/vllm
文檔:docs.vllm.ai


SGLang 13.4K 星標
項目:https://github.com/sgl-project/sglang
文檔:docs.sglang.ai/

純個人感受,我還是比較喜歡 vLLM,之前多次用 vLLM 引擎部署過大模型:

說回標題,vLLM 前幾天發了一個性能更新的推,測試了在 8x H200 上,vLLM 在 DeepSeek V3/R1 模型的吞吐量方面領先,還期待與 DeepSeek 的推理引擎開源計劃合作,實現進一步的提升。


這里面有兩個點

一是它配圖中對比了不同場景下與 SGLang 和 TensorRT 這兩個推理引擎的對比數據,vLLM 短進短出情況下遙遙領先,后面幾個場景中 SGLang 甚至被 TensorRT 超越

二是它期待的與 DeeSeek 的開源合作,這是前幾天 DeepSeek [[2025-04-19-剛剛,DeepSeek 宣布,準備開源推理引擎]] 中說到其開源引擎是基于 vllm 魔改,準備開源

然后 SGLang 直接回應了這條,并置頂了回復:我們對比了 vLLM 0.8.4 和 SGLang 0.4.5.post1 的離線性能。基準測試結果表明,SGLang 在所有情況下都優于 vLLM,大多數情況下領先約 10%,最大領先幅度為 38%。


也有網友表示,可以輕松調整 SGLang,使其性能比 vLLM 高出 23%。

lmsysorg 聯合創始人 Lianmin Zheng 親自下場,表示 vLLM 發布的基準測試結果存在明顯的誤導性,SGLang 官方可以測出比 vLLM 更好的結果。并生成這已經不是 vLLM 第一次分享誤導性信息,應該考慮刪除這篇帖子以維護聲譽。

然后 vLLM 連續發布了兩個測試結果,表示沒有發布誤導性的結果,它可以通過精確的命令和環境重現。



Lianmin Zheng 說vLLM后續這兩張圖中 TRT - LLM 結果在 ShareGPT 上比之前快兩倍,在 1k - in - 2k - out 上比之前快 1.6 倍,SGLang 也是如此,這恰好證明了之前的結果存在誤導性。

話說,類似測試、打臉、再測試屬實沒什么意義。各家的推理引擎都在不斷進行各種優化,即便是同一版本的模型,各家進行測試時,本身就更傾向于對自家引擎的各種參數設置上多加權衡,而對競爭對手的引擎的參數可能考慮就沒有那么多了。

這一波,我站SGLang,vLLM自己測試可以,在某個版本上提升多少隨便怎么吹都可以,沒必要拉上SGLang和TensorRT。


最后,我建議兩家別吵了,同時建議大家感受一下我最近在用的 Xinferece v 1.5,它直接支持了vllm、sglang、llama.cpp、transformers、MLX等推理引擎,還提供了可視化界面管理各種大模型。

配置與使用方式詳見文檔:https://inference.readthedocs.io/zh-cn/latest/models/virtualenv.html

更新指南

  • pip:pip install 'xinference==1.5.0'

  • Docker:拉取最新版本即可,也可以直接在鏡像內用 pip 更新。

? 功能增強

  • Gradio 聊天界面支持展示思考過程(需打開“解析思維過程”)

  • Vision 模型支持 min/max_pixels 控制輸入分辨率

  • 模型下載支持進度顯示與取消

  • ?? 默認并發數設置為 CPU 核心數

  • 支持 InternVL3 的 AWQ 推理

  • ? 默認使用最新版 xllamacpp 引擎

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
600415,“大牛股”盤中跌停!發生了什么

600415,“大牛股”盤中跌停!發生了什么

新浪財經
2025-06-27 16:49:07
里夫斯拒四年8920萬續約:明夏可追五年2.46億 湖媒直言該交易他

里夫斯拒四年8920萬續約:明夏可追五年2.46億 湖媒直言該交易他

顏小白的籃球夢
2025-06-27 00:54:08
2025溫網女單簽表公布!鄭欽文首輪遇苦主,王欣瑜首輪穆霍娃

2025溫網女單簽表公布!鄭欽文首輪遇苦主,王欣瑜首輪穆霍娃

女網連連看
2025-06-27 20:30:13
“假球”都解釋不了,中國三人男籃闖進世界杯8強,劇情太狗血

“假球”都解釋不了,中國三人男籃闖進世界杯8強,劇情太狗血

真理是我親戚
2025-06-27 15:27:29
二道販子太可惡!小米yu7閑魚訂單鋪天蓋地,雷總管管吧

二道販子太可惡!小米yu7閑魚訂單鋪天蓋地,雷總管管吧

牛斯克
2025-06-27 09:31:18
張學良兒子張閭琳辭世:9歲赴美,娶陳濟棠侄女,所生兩子皆成才

張學良兒子張閭琳辭世:9歲赴美,娶陳濟棠侄女,所生兩子皆成才

柳絮憶史
2025-06-17 08:35:03
追求標準答案危害無窮

追求標準答案危害無窮

水寒說語文
2025-06-26 17:30:16
緊急避雷!“毒兒童牙膏”相繼曝光,絕非危言聳聽,家長速自查!

緊急避雷!“毒兒童牙膏”相繼曝光,絕非危言聳聽,家長速自查!

阿傖說事
2025-06-26 08:02:00
你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技
2025-06-25 16:18:11
這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

素衣讀史
2025-06-21 14:13:38
硅谷殺妻案背后:于軒一從沒有被愛過,對方一直與前女友藕斷絲連

硅谷殺妻案背后:于軒一從沒有被愛過,對方一直與前女友藕斷絲連

史行途
2025-06-27 18:32:58
貝佐斯夫婦威尼斯婚禮歡迎晚宴賓客們, 小李子,卡戴珊家族等人

貝佐斯夫婦威尼斯婚禮歡迎晚宴賓客們, 小李子,卡戴珊家族等人

老吳教育課堂
2025-06-27 15:55:43
中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

Steam社區
2025-06-26 11:57:21
月薪3萬offer,進去半年就廢了?高薪陷阱,正在毀掉一批年輕人…

月薪3萬offer,進去半年就廢了?高薪陷阱,正在毀掉一批年輕人…

火山詩話
2025-06-26 16:49:29
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
今年養老金調整有點“小意外”,通知要7月公布嗎?誰能漲的多?

今年養老金調整有點“小意外”,通知要7月公布嗎?誰能漲的多?

小舟談歷史
2025-06-26 08:44:01
李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

檸檬有娛樂
2025-06-27 10:13:46
補助標準99元/人,今年全國老年人免費健康體檢項目再擴容

補助標準99元/人,今年全國老年人免費健康體檢項目再擴容

每日經濟新聞
2025-06-26 21:32:42
我媽和二嬸不對付,鄰居蓋房占地二嬸吵不贏,我媽擼起袖子沖上去

我媽和二嬸不對付,鄰居蓋房占地二嬸吵不贏,我媽擼起袖子沖上去

多多故事薈
2025-06-10 09:10:03
李月汝首發狂砍15+10,主帥稱贊表現出色

李月汝首發狂砍15+10,主帥稱贊表現出色

發財西瓜
2025-06-27 12:25:38
2025-06-27 21:40:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

健康
游戲
家居
本地
公開課

呼吸科專家破解呼吸道九大謠言!

英雄聯盟新英雄蕓阿娜模型圖 溫泉皮有“玉足”

家居要聞

明亮寬敞 空間合理安排

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 安多县| 福海县| 鹤山市| 文山县| 农安县| 鱼台县| 稷山县| 舞钢市| 柳州市| 桦南县| 响水县| 长兴县| 政和县| 怀远县| 吉林省| 黑山县| 古交市| 财经| 嘉义县| 承德县| 石林| 华池县| 卓尼县| 家居| 聂拉木县| 巴中市| 津市市| 渝中区| 马尔康县| 蕉岭县| 霞浦县| 同心县| 青川县| 安丘市| 邢台市| 襄城县| 安达市| 水富县| 万安县| 固安县| 安福县|