99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一體機(jī),阻礙DeepSeek性能的最大絆腳石!

0
分享至

一體機(jī)是DeepSeek交付的最佳方式嗎?

恰恰相反,一體機(jī)是阻礙DeepSeek提升推理性能的最大絆腳石。



為啥?

只因DeepSeek這個(gè)模型有點(diǎn)特殊,它是個(gè)高稀疏度的MoE模型。

MoE這種混合專家模型,設(shè)計(jì)的初衷是通過“激活一堆專家中的少量專家”,來達(dá)到減少計(jì)算量、提升推理效率的目標(biāo)。

舉個(gè)例子,MoE模型好比是一個(gè)超級(jí)大飯店的后廚,這個(gè)后廚里有幾百個(gè)大廚,每個(gè)大廚擅長(zhǎng)做不同菜系川菜廚子、魯菜廚子、湘菜廚子…

這些廚子就相當(dāng)于不同領(lǐng)域的專家。



其中有個(gè)人是廚師長(zhǎng),廚師長(zhǎng)不負(fù)責(zé)炒菜,他清楚地知道每個(gè)廚師擅長(zhǎng)做什么菜。

這個(gè)廚師長(zhǎng)就是MoE模型中的門控網(wǎng)絡(luò)。



每次顧客點(diǎn)菜的時(shí)候,廚師長(zhǎng)(門控網(wǎng)絡(luò))會(huì)根據(jù)顧客點(diǎn)菜的需求以及自己對(duì)廚師能力的了解,安排擅長(zhǎng)做這些菜的廚子炒菜。



這樣,酒店的后廚就不必為每位廚師安排灶眼,只需少量灶眼(比如8個(gè)),供那些需要上崗炒菜(被激活)的廚師使用就可以了。

這就相當(dāng)于MoE的原理:只激活少量專家,從而大幅降低計(jì)算量。



是不是看起來很不錯(cuò),但是有一點(diǎn)很重要:不參與炒菜的廚子們雖然不占用灶眼,但是還是要擠在后廚隨時(shí)等待召喚。

也就是說,MoE模型里那些未激活專家,雖然不消耗算力,但它們的參數(shù)量仍然要占用顯存/內(nèi)存,帶來巨大的存儲(chǔ)開銷和調(diào)度復(fù)雜性。



回過頭來,我們?cè)賮砜碊eepSeek-R1/V3,是稀疏度極高的MoE模型(總參數(shù)量6710億,激活量370億)。

按照DeepSeek官方的最新披露,模型每層256個(gè)專家,只有8個(gè)被激活(V3的Transformer 層數(shù)設(shè)置為 61 層)。

好比你的飯店有60多個(gè)后廚房間,每個(gè)屋里放256個(gè)廚師,同時(shí)只有8個(gè)廚師干活,其他待命。

你想想,恐怕只有新東方廚師專修學(xué)院才這么干吧。



這就意味著,你需要配置超高的一體機(jī)(大顯存、大內(nèi)存),才能夠運(yùn)行滿血版DeepSeek。

事實(shí)證明,目前的狀況也的確如此,市面上的“真·滿血DeepSeek一體機(jī)”價(jià)格都是100萬(wàn)起,甚至要大幾百萬(wàn)。



把MoE模型裝進(jìn)一體機(jī)的不科學(xué)之處在于↓

我花了大錢買了一堆不能同時(shí)干活的專家,只為他們可以減少計(jì)算量。
然而,這種一體機(jī)部署模式算力是我買斷的,難道不應(yīng)該讓他們盡量都干活,從而讓算力最大化使用嗎?
我的顯存/內(nèi)存/硬盤都是為了裝下6710億參數(shù),但實(shí)際干活只有370億參數(shù)…

所以,我們的觀點(diǎn)是:

一體機(jī)其實(shí)是運(yùn)行DeepSeek這種MoE模型的最差選擇,更適合運(yùn)行那些非MoE的全參數(shù)激活模型。

這一點(diǎn),大家如果仔細(xì)看上周DeepSeek官方在知乎披露的推理優(yōu)化架構(gòu)就明白了。

人家說的很清楚,要想獲得“更大的吞吐、更低的延遲”,核心就是要使用「大規(guī)模跨節(jié)點(diǎn)專家并行」。

你一體機(jī)就單個(gè)節(jié)點(diǎn)、8張卡,勉強(qiáng)裝下所有專家,還并行個(gè)毛線啊?



按照DeepSeek給出的官方參考推理架構(gòu)(專家并行、數(shù)據(jù)并行、PD分離):

Prefill階段:部署單元4節(jié)點(diǎn)(32張H800),32路專家并行和數(shù)據(jù)并行。
Decode階段:部署單元18節(jié)點(diǎn)(144張H800),144路專家并行和數(shù)據(jù)并行。

這就意味著,一個(gè)22節(jié)點(diǎn)的集群(176張卡),才能發(fā)揮出最優(yōu)的推理吞吐和延遲。(讓每個(gè)專家獲得足夠的輸入,都忙活起來,而不是“占著茅坑不拉屎



正因?yàn)檫@種采用這種大規(guī)模并行架構(gòu),DeepSeek官方給出的單服務(wù)器平均推理性能才高得離譜(輸入:73.7k tokens/s,輸出14.8k tokens/s)。

而一體機(jī)廠商們給出的性能,輸出+輸入的總和最多也不過4k tokens/s。



當(dāng)然,我們并不是要否定大模型一體機(jī),只是一體機(jī)不適合部署MoE模型,讓它跑個(gè)稠密模型,不需要大規(guī)模并行的,還是很好的。

眼下DeepSeek一體機(jī)滿天飛,更多的還是滿足客戶的情緒價(jià)值:本地化、開箱即用、專屬性……



尤其在數(shù)據(jù)隱私方面,一體機(jī)有著無與倫比的優(yōu)勢(shì),不只是合規(guī),更能切實(shí)有效的保護(hù)數(shù)據(jù)不出域。

比如,很多通過API、WEB或APP提供DeepSeek服務(wù)的供應(yīng)商,在他們的用戶協(xié)議里可能赫然寫著“…我們可能會(huì)將服務(wù)所收集的輸入及對(duì)應(yīng)輸出,用于本協(xié)議下服務(wù)的優(yōu)化…”。



這對(duì)于大部分企業(yè)級(jí)客戶來說,這都是無法接受的,所以本地化部署肯定是剛需,這也是目前DeepSeek一體機(jī)火爆的原因(即便性能不佳)。

其實(shí),很多企業(yè)過去兩年自己囤過算力,此時(shí)參考DeepSeek的大規(guī)模并行架構(gòu),部署起來,相信會(huì)有不錯(cuò)的效果。

而滿血版的DeepSeek一體機(jī),企業(yè)可以量預(yù)算而行,不要硬上:

第一,蒸餾版,體積小性能好,效果差點(diǎn)不耽誤練手;
第二,最近新模型層出不窮,可以嘗試下非MoE架構(gòu)的小體積新模型;
第三,相信不久的將來下一代DeepSeek就會(huì)發(fā)布,屆時(shí)再下手也不遲。

大模型的前方是星辰大海,但我們,才剛剛上路呢。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一外地游客在長(zhǎng)沙熱到呼吸性堿中毒,提醒:高溫或誘發(fā)呼吸性堿中毒

一外地游客在長(zhǎng)沙熱到呼吸性堿中毒,提醒:高溫或誘發(fā)呼吸性堿中毒

極目新聞
2025-07-16 18:41:56
看到李夢(mèng)的真實(shí)處境,才明白宮魯鳴為何不重用,不僅是化妝有分歧

看到李夢(mèng)的真實(shí)處境,才明白宮魯鳴為何不重用,不僅是化妝有分歧

二月侃事
2025-06-18 14:56:16
2025年養(yǎng)老金調(diào)整,與工齡掛鉤,15年,33年,42年上漲差距多少?

2025年養(yǎng)老金調(diào)整,與工齡掛鉤,15年,33年,42年上漲差距多少?

興史興談
2025-07-16 08:01:29
破防了!中國(guó)越來越不需要韓國(guó)芯片,韓媒:無法接受被中國(guó)趕超

破防了!中國(guó)越來越不需要韓國(guó)芯片,韓媒:無法接受被中國(guó)趕超

毒sir財(cái)經(jīng)
2025-06-19 23:08:32
亞馬爾:巴薩是我的生命,梅西已經(jīng)走出了自己的路我也將走自己的

亞馬爾:巴薩是我的生命,梅西已經(jīng)走出了自己的路我也將走自己的

直播吧
2025-07-17 04:43:36
OpenAI 工程師最新演講:代碼只占程序員核心價(jià)值的 10%,未來屬于“結(jié)構(gòu)化溝通”

OpenAI 工程師最新演講:代碼只占程序員核心價(jià)值的 10%,未來屬于“結(jié)構(gòu)化溝通”

AI科技大本營(yíng)
2025-07-15 16:37:57
高207米!騰訊廣州“火箭臺(tái)”大樓竣工

高207米!騰訊廣州“火箭臺(tái)”大樓竣工

GA環(huán)球建筑
2025-07-15 22:05:59
今晚19:30!CCTV5直播亞洲杯重要賽事:中國(guó)女籃沖擊4強(qiáng)

今晚19:30!CCTV5直播亞洲杯重要賽事:中國(guó)女籃沖擊4強(qiáng)

煙潯渺渺
2025-07-17 03:09:20
打到莫斯科?特朗普想法很大膽,中國(guó)或受牽連,接下來該普京出牌

打到莫斯科?特朗普想法很大膽,中國(guó)或受牽連,接下來該普京出牌

叮當(dāng)當(dāng)科技
2025-07-17 06:54:35
辱不了洋人,還辱不了你?

辱不了洋人,還辱不了你?

一代文嚎
2025-07-15 20:52:55
香港,又香了!信號(hào)無比強(qiáng)烈

香港,又香了!信號(hào)無比強(qiáng)烈

智谷趨勢(shì)
2025-07-16 09:33:11
毛岸英犧牲后,劉思齊改嫁河北青年楊茂之生四子,他究竟是什么人

毛岸英犧牲后,劉思齊改嫁河北青年楊茂之生四子,他究竟是什么人

萬(wàn)物知識(shí)圈
2025-07-16 11:29:01
6個(gè)交易日,暴漲超250%!3次停牌核查,2人被罰!

6個(gè)交易日,暴漲超250%!3次停牌核查,2人被罰!

證券時(shí)報(bào)e公司
2025-07-16 23:06:37
退休教師順雞蛋當(dāng)場(chǎng)身亡,兒子索賠超市38萬(wàn),法院判決讓人佩服

退休教師順雞蛋當(dāng)場(chǎng)身亡,兒子索賠超市38萬(wàn),法院判決讓人佩服

南南史
2025-01-15 10:54:19
果然有猛料!打記者企業(yè)稱機(jī)密被侵犯,警方通告,打砸是冰山一角

果然有猛料!打記者企業(yè)稱機(jī)密被侵犯,警方通告,打砸是冰山一角

說說史事
2025-07-16 11:42:33
外媒:疑因允許在“里根”號(hào)航母上舉辦女裝變裝秀,美軍第七艦隊(duì)司令提名被撤

外媒:疑因允許在“里根”號(hào)航母上舉辦女裝變裝秀,美軍第七艦隊(duì)司令提名被撤

環(huán)球網(wǎng)資訊
2025-07-14 14:31:47
75年得知王恩茂境況,主席大怒:怎能當(dāng)?shù)匚睍洠恐甘痉峙滠婈?duì)

75年得知王恩茂境況,主席大怒:怎能當(dāng)?shù)匚睍洠恐甘痉峙滠婈?duì)

咸説歷史
2025-06-26 16:58:18
泰王新寵小妾巴帕頌坐他身邊,蘇提達(dá)滿臉不高興,泰王趕緊哄她

泰王新寵小妾巴帕頌坐他身邊,蘇提達(dá)滿臉不高興,泰王趕緊哄她

笑傲春秋
2025-07-16 11:30:22
2025年上海市頭部高中超級(jí)四校、八大金剛、新五虎

2025年上海市頭部高中超級(jí)四校、八大金剛、新五虎

特特農(nóng)村生活
2025-07-16 19:44:48
貴州29歲女子連生5娃,住大平層睡醒就吃還打牌,聲稱還能再生倆

貴州29歲女子連生5娃,住大平層睡醒就吃還打牌,聲稱還能再生倆

葡萄說娛
2025-07-16 15:28:21
2025-07-17 08:16:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1027文章數(shù) 716關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)外賣大戰(zhàn)總指揮:不想卷 但不能不反擊

頭條要聞

媒體:黃楊鈿甜"耳環(huán)"事件 一場(chǎng)質(zhì)疑與謠言茍合的鬧劇

頭條要聞

媒體:黃楊鈿甜"耳環(huán)"事件 一場(chǎng)質(zhì)疑與謠言茍合的鬧劇

體育要聞

不給楊瀚森傳球,他有自己的理由

娛樂要聞

都美竹將參加綜藝,單身媽媽發(fā)文抵制

財(cái)經(jīng)要聞

探究萬(wàn)億市場(chǎng)的休閑零食

汽車要聞

理想i8內(nèi)飾官圖公布 李想回應(yīng)"被打臉"

態(tài)度原創(chuàng)

旅游
教育
本地
游戲
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

全等三角形動(dòng)點(diǎn)問題,方法大總結(jié)!

本地新聞

“別墅里面唱K”怎么就成了臺(tái)灣人的跳舞開關(guān)

夢(mèng)幻西游:從100億到5000億,你身上的經(jīng)驗(yàn)會(huì)不會(huì)越來越值錢?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 巴南区| 公主岭市| 泸水县| 高要市| 开化县| 龙游县| 嘉义县| 中西区| 新余市| 哈尔滨市| 广河县| 潞西市| 沁源县| 霞浦县| 彭水| 洛阳市| 正宁县| 和政县| 习水县| 海淀区| 克什克腾旗| 宜黄县| 永兴县| 鄄城县| 信阳市| 岳西县| 山阴县| 纳雍县| 淄博市| 县级市| 长海县| 博白县| 广宗县| 青浦区| 胶州市| 克山县| 班玛县| 乐山市| 邯郸市| 嫩江县| 西乌珠穆沁旗|