99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

一體機,阻礙DeepSeek性能的最大絆腳石!

0
分享至

一體機是DeepSeek交付的最佳方式嗎?

恰恰相反,一體機是阻礙DeepSeek提升推理性能的最大絆腳石。



為啥?

只因DeepSeek這個模型有點特殊,它是個高稀疏度的MoE模型。

MoE這種混合專家模型,設計的初衷是通過“激活一堆專家中的少量專家”,來達到減少計算量、提升推理效率的目標。

舉個例子,MoE模型好比是一個超級大飯店的后廚,這個后廚里有幾百個大廚,每個大廚擅長做不同菜系川菜廚子、魯菜廚子、湘菜廚子…

這些廚子就相當于不同領域的專家。



其中有個人是廚師長,廚師長不負責炒菜,他清楚地知道每個廚師擅長做什么菜。

這個廚師長就是MoE模型中的門控網絡。



每次顧客點菜的時候,廚師長(門控網絡)會根據顧客點菜的需求以及自己對廚師能力的了解,安排擅長做這些菜的廚子炒菜。



這樣,酒店的后廚就不必為每位廚師安排灶眼,只需少量灶眼(比如8個),供那些需要上崗炒菜(被激活)的廚師使用就可以了。

這就相當于MoE的原理:只激活少量專家,從而大幅降低計算量。



是不是看起來很不錯,但是有一點很重要:不參與炒菜的廚子們雖然不占用灶眼,但是還是要擠在后廚隨時等待召喚。

也就是說,MoE模型里那些未激活專家,雖然不消耗算力,但它們的參數量仍然要占用顯存/內存,帶來巨大的存儲開銷和調度復雜性。



回過頭來,我們再來看DeepSeek-R1/V3,是稀疏度極高的MoE模型(總參數量6710億,激活量370億)。

按照DeepSeek官方的最新披露,模型每層256個專家,只有8個被激活(V3的Transformer 層數設置為 61 層)。

好比你的飯店有60多個后廚房間,每個屋里放256個廚師,同時只有8個廚師干活,其他待命。

你想想,恐怕只有新東方廚師專修學院才這么干吧。



這就意味著,你需要配置超高的一體機(大顯存、大內存),才能夠運行滿血版DeepSeek。

事實證明,目前的狀況也的確如此,市面上的“真·滿血DeepSeek一體機”價格都是100萬起,甚至要大幾百萬。



把MoE模型裝進一體機的不科學之處在于↓

我花了大錢買了一堆不能同時干活的專家,只為他們可以減少計算量。
然而,這種一體機部署模式算力是我買斷的,難道不應該讓他們盡量都干活,從而讓算力最大化使用嗎?
我的顯存/內存/硬盤都是為了裝下6710億參數,但實際干活只有370億參數…

所以,我們的觀點是:

一體機其實是運行DeepSeek這種MoE模型的最差選擇,更適合運行那些非MoE的全參數激活模型。

這一點,大家如果仔細看上周DeepSeek官方在知乎披露的推理優化架構就明白了。

人家說的很清楚,要想獲得“更大的吞吐、更低的延遲”,核心就是要使用「大規模跨節點專家并行」。

你一體機就單個節點、8張卡,勉強裝下所有專家,還并行個毛線啊?



按照DeepSeek給出的官方參考推理架構(專家并行、數據并行、PD分離):

Prefill階段:部署單元4節點(32張H800),32路專家并行和數據并行。
Decode階段:部署單元18節點(144張H800),144路專家并行和數據并行。

這就意味著,一個22節點的集群(176張卡),才能發揮出最優的推理吞吐和延遲。(讓每個專家獲得足夠的輸入,都忙活起來,而不是“占著茅坑不拉屎



正因為這種采用這種大規模并行架構,DeepSeek官方給出的單服務器平均推理性能才高得離譜(輸入:73.7k tokens/s,輸出14.8k tokens/s)。

而一體機廠商們給出的性能,輸出+輸入的總和最多也不過4k tokens/s。



當然,我們并不是要否定大模型一體機,只是一體機不適合部署MoE模型,讓它跑個稠密模型,不需要大規模并行的,還是很好的。

眼下DeepSeek一體機滿天飛,更多的還是滿足客戶的情緒價值:本地化、開箱即用、專屬性……



尤其在數據隱私方面,一體機有著無與倫比的優勢,不只是合規,更能切實有效的保護數據不出域。

比如,很多通過API、WEB或APP提供DeepSeek服務的供應商,在他們的用戶協議里可能赫然寫著“…我們可能會將服務所收集的輸入及對應輸出,用于本協議下服務的優化…”。



這對于大部分企業級客戶來說,這都是無法接受的,所以本地化部署肯定是剛需,這也是目前DeepSeek一體機火爆的原因(即便性能不佳)。

其實,很多企業過去兩年自己囤過算力,此時參考DeepSeek的大規模并行架構,部署起來,相信會有不錯的效果。

而滿血版的DeepSeek一體機,企業可以量預算而行,不要硬上:

第一,蒸餾版,體積小性能好,效果差點不耽誤練手;
第二,最近新模型層出不窮,可以嘗試下非MoE架構的小體積新模型;
第三,相信不久的將來下一代DeepSeek就會發布,屆時再下手也不遲。

大模型的前方是星辰大海,但我們,才剛剛上路呢。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
不覺得尷尬嗎?男子體驗泡泡浴,搓澡按摩全由技師伺候,太享受了

不覺得尷尬嗎?男子體驗泡泡浴,搓澡按摩全由技師伺候,太享受了

唐小糖說情感
2025-05-20 09:06:03
刻在DNA里的默契梅西任意球打近角,蘇牙在門將身前阻擋視野

刻在DNA里的默契梅西任意球打近角,蘇牙在門將身前阻擋視野

直播吧
2025-05-25 10:12:07
里奇-保羅:喬丹不用離開&總決賽對手弱 其經紀人可挑超巨更多

里奇-保羅:喬丹不用離開&總決賽對手弱 其經紀人可挑超巨更多

直播吧
2025-05-25 08:47:05
最無厘頭的勝仗!眼看要輸一緊張發錯命令,結果打得敵人全軍覆沒

最無厘頭的勝仗!眼看要輸一緊張發錯命令,結果打得敵人全軍覆沒

大千世界觀
2025-05-24 14:30:08
被年輕人的“住酒店智慧”驚呆了,換個思路后,就解決了很多痛點

被年輕人的“住酒店智慧”驚呆了,換個思路后,就解決了很多痛點

阿離家居
2025-05-22 07:33:56
比亞迪將在匈牙利工廠生產海鷗,目標讓當地用戶視其為歐洲品牌

比亞迪將在匈牙利工廠生產海鷗,目標讓當地用戶視其為歐洲品牌

IT之家
2025-05-23 15:52:15
蘋果從榜1到榜3只需一個特朗普 特朗普頻頻向庫克發難

蘋果從榜1到榜3只需一個特朗普 特朗普頻頻向庫克發難

大象新聞
2025-05-25 08:51:08
抗美援朝尾聲,朝鮮后方女性眾多,志愿軍鐵律:作風問題一律槍斃

抗美援朝尾聲,朝鮮后方女性眾多,志愿軍鐵律:作風問題一律槍斃

尋途
2025-05-18 01:15:26
A股:不用等明天!行情已經明牌!下周一,大盤走勢分析

A股:不用等明天!行情已經明牌!下周一,大盤走勢分析

郭小凡財經
2025-05-25 08:10:50
國內將逐漸停止“心臟支架”手術?做完人就廢了?醫生告訴您真相

國內將逐漸停止“心臟支架”手術?做完人就廢了?醫生告訴您真相

39健康網
2025-05-15 18:02:12
利物浦球迷先別高興!維爾茨的轉會要黃了!要價1.5億芬威不想給

利物浦球迷先別高興!維爾茨的轉會要黃了!要價1.5億芬威不想給

球圈bot
2025-05-25 13:57:22
深圳最難賣的10個樓盤

深圳最難賣的10個樓盤

樓市諸葛
2025-05-25 07:50:02
美國陰謀得逞?馬來西亞棄用華為,中方一招制敵,24小時絕地反擊

美國陰謀得逞?馬來西亞棄用華為,中方一招制敵,24小時絕地反擊

通鑒史智
2025-05-25 11:50:08
奧尼爾解析哈登為何關鍵時刻總隱身:他打球太在乎外界怎么說了

奧尼爾解析哈登為何關鍵時刻總隱身:他打球太在乎外界怎么說了

kio魚
2025-05-25 08:40:32
數百架無人機大空襲!擊中多個俄羅斯軍工廠,烏軍恢復襲擊煉油廠

數百架無人機大空襲!擊中多個俄羅斯軍工廠,烏軍恢復襲擊煉油廠

鷹眼Defence
2025-05-23 17:36:08
做人要厚道!她微笑悼念朱媛媛還趁機帶貨遭痛罵,喜提全網塌房

做人要厚道!她微笑悼念朱媛媛還趁機帶貨遭痛罵,喜提全網塌房

阿廢冷眼觀察所
2025-05-25 00:40:21
拜仁大清洗:6將離隊,換1億歐元轉會費,騰出6000萬年薪空間!

拜仁大清洗:6將離隊,換1億歐元轉會費,騰出6000萬年薪空間!

廣西阿妹香香
2025-05-25 14:50:31
00后小伙為賺錢應聘男優,半年拍攝160部電影,被捕時雙腿瘦如柴

00后小伙為賺錢應聘男優,半年拍攝160部電影,被捕時雙腿瘦如柴

春序娛樂
2025-05-25 10:46:23
該來的還是來了,國家果斷對李氏家族出手,李嘉誠晚節不保

該來的還是來了,國家果斷對李氏家族出手,李嘉誠晚節不保

獵火照狼山
2025-05-24 19:33:40
這3個國家最不歡迎中國人,滿臉都是嫌棄,卻總有國人上趕著去

這3個國家最不歡迎中國人,滿臉都是嫌棄,卻總有國人上趕著去

博覽歷史
2025-05-23 11:08:28
2025-05-25 16:40:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1003文章數 717關注度
往期回顧 全部

科技要聞

馬斯克宣布回歸7x24小時工作狀態

頭條要聞

受到黨內嚴重警告兩年后 85后官員擬獲提拔

頭條要聞

受到黨內嚴重警告兩年后 85后官員擬獲提拔

體育要聞

武漢女足:從大學校園,到亞洲之巔

娛樂要聞

朱媛媛只留給女兒一句話,卻字字千金

財經要聞

重組膠原測不到膠原?800億醫美巨頭回應

汽車要聞

賽博風旗艦轎車 全新小鵬P7申報信息曝光

態度原創

時尚
本地
房產
家居
數碼

伊姐周日熱推:電視劇《陷入我們的熱戀》;電視劇《在人間》......

本地新聞

巴黎沒有倍兒甜,但天津巧克力腦袋倍兒多

房產要聞

連續17次提前交付!海口這座頂流紅盤,業主贏麻了!

家居要聞

輕奢品質 開闊的三口之家

數碼要聞

英特爾發布入門級“Core Ultra 200”工作站、臺式機和筆記本電腦CPU

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 巍山| 肇东市| 南汇区| 兴海县| 凌云县| 拜城县| 鹤壁市| 巴塘县| 安吉县| 卢氏县| 阳江市| 资中县| 宁陕县| 寿阳县| 五大连池市| 林州市| 鸡西市| 庄河市| 盱眙县| 天全县| 马尔康县| 板桥市| 新宾| 五家渠市| 明水县| 彰化县| 苍山县| 屏南县| 沭阳县| 稷山县| 青川县| 泌阳县| 长宁县| 华安县| 扎鲁特旗| 清河县| 泸水县| 沂南县| 略阳县| 太康县| 开化县|