99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek工程師最新開源,1200行代碼,輕量,快速大模型推理

0
分享至

來源:機器之心

開源社區的人應該對 vLLM 不陌生,它是一個由加州大學伯克利分校團隊開發的高性能、開源 LLM 推理和服務引擎,核心目標是提升 LLM 的推理速度(吞吐量)和資源利用率(尤其是內存),同時兼容 Hugging Face 等流行模型庫。

簡單來說,vLLM 能讓 GPT、Mistral、LLaMA 等主流模型系列跑得更快、消耗更少資源,取得這些效果的關鍵是其創新的注意力機制實現方案 ——PagedAttention。

近日,DeepSeek AI 研究者、深度學習系統工程師俞星凱從零開始構建了一個輕量級 vLLM 實現 ——Nano-vLLM,將代碼簡化到了 1200 行

目前,該項目在 GitHub 上收獲了 200 多的 Star。


GitHub 地址:https://github.com/GeeeekExplorer/nano-vllm/tree/main

具體來講,Nano-vLLM 具有以下三個核心亮點:

一是,快速離線推理。推理速度與 vLLM 相當。

二是,易讀代碼庫。實現非常簡潔,Python 代碼減少到了 1200 行以下。

三是,優化套件。提供 Prefix 緩存、Torch 編譯、CUDA 計算圖等功能。

俞星凱在基準測試中采用了以下測試配置:

  • 硬件:RTX 4070

  • 模型:Qwen3-0.6B

  • 總請求:256 個序列

  • 輸入長度:100–1024 tokens 之間隨機采樣

  • 輸出長度:100–1024 tokens 之間隨機采樣

基準測試結果如下表所示,Nano-vLLM 與 vLLM 的輸出 token 相同,時間略長,推理速度(吞吐量)稍遜一點點。整體而言,二者表現相當。


作者簡介

Nano-vLLM 開發者俞星凱目前就職于 DeepSeek,參與過 DeepSeek-V3 和 DeepSeek-R1 的開發工作。


有意思的是,根據其 GitHub 主頁,他還曾開發過一個植物大戰僵尸 Qt 版,該項目也已經收獲了 270 多星。此外,由于畢業于南京大學,他還曾參與了不少南京大學的計算機項目,包括南京大學計算機圖形學繪圖系統、南京大學分布式系統 Raft 算法最簡實現、南京大學操作系統 OSLab 等。

而根據其 LinkedIn 頁面可知,他曾先后在騰訊、幻方(DeepSeek 母公司)和字節跳動實習過。2023 年后入職 DeepSeek 成為深度學習系統工程師。


你是 vLLM 用戶嗎?會考慮嘗試 Nano-vLLM 嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技
2025-06-25 16:18:11
63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

TVB的四小花
2025-06-16 02:57:47
杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

秘密清風
2025-06-27 14:01:20
李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

檸檬有娛樂
2025-06-27 10:13:46
追求標準答案危害無窮

追求標準答案危害無窮

水寒說語文
2025-06-26 17:30:16
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

醉臥浮生
2025-06-27 15:48:22
財政部:截至5月末全國地方政府債務余額512475億元

財政部:截至5月末全國地方政府債務余額512475億元

澎湃新聞
2025-06-27 10:36:06
艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

火山詩話
2025-06-26 06:42:34
當年為什么查辦褚時健?

當年為什么查辦褚時健?

顧史
2025-06-09 20:26:22
又一個經濟奇跡——孟加拉國

又一個經濟奇跡——孟加拉國

古老板的老巢
2025-06-24 23:41:45
博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

懂球帝
2025-06-27 08:40:19
洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

嘆知
2025-06-23 10:34:33
中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

Steam社區
2025-06-26 11:57:21
絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

墻頭草
2025-04-01 12:00:11
昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

一盅情懷
2025-06-27 15:54:59
1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

金融界
2025-06-26 23:50:34
塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

東球弟
2025-06-27 12:34:08
笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

深析古今
2025-06-27 17:14:39
萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

史行途
2025-06-27 15:07:11
2025-06-27 21:44:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

教育
時尚
房產
數碼
藝術

教育要聞

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

到了夏天,中年女人穿過膝裙不配運動鞋,才能美得優雅又得體

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

數碼要聞

極摩客 EVO-X2 AI 桌面主機圖賞:輕巧緊湊,銳龍AI Max+ 395加持

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 阿勒泰市| 桦甸市| 屏东市| 青川县| 涞水县| 阆中市| 华坪县| 兰坪| 吉林市| 乌兰浩特市| 贵港市| 呼图壁县| 阳泉市| 奉贤区| 南部县| 茶陵县| 临桂县| 勃利县| 黑水县| 明光市| 得荣县| 镇雄县| 启东市| 泗水县| 通州市| 青龙| 南充市| 南城县| 彭州市| 吕梁市| 富锦市| 商南县| 定兴县| 遵义市| 分宜县| 屯留县| 柳州市| 尚义县| 江门市| 油尖旺区| 阳江市|