99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek攪局,算力生意玩法大變樣

0
分享至

2025年的第一個季度,就這樣嗖地一下過完了~



作為算力圈的“老黃牛”,過去的一年,老丘生意可謂風生水起。

可是轉過年來,老丘敏銳的感覺到:有點不對勁,生意明顯少多了。



這個不對勁的源頭,其實就是DeepSeek

過去兩年,國內各種大模型百花齊放,訓練需求激增,大巨頭、小獨角、傳統IT大廠,甚至行業大甲方們,都想自己訓練個模型出出風頭。

所以,老丘的“賣鏟子”生意也很火。



可是,自從DeepSeek新春炸場以來,風云突變,人們發現這市場上根本不需要那么多大模型,有兩三個好用的就夠了。

于是乎,很多大規模訓練的需求,一夜之間退潮了,取而代之的大量的后訓練和推理需求。



老丘很不幸成為這波退潮的“受害者”,他之前手里的那些智算中心,當初建設的初衷都是打譜做預訓練用的。

現在客戶上來就要推理,尤其還要看跑DeepSeek的效果,純搞訓練不香了。



每次被客戶拷問,老丘都無言以對,眼看Q1就要結束了,也沒找到破局之道。

直到3月底,他去參加了一場會…

這場不同尋常的會,讓老丘的格局瞬間打開了。











這是一場怎樣的會議呢?

首先,舉辦的地點不尋常——

會議的舉辦地設在甘肅慶陽,瞬間就吊起了老丘的胃口。

下了車,老丘看到那一排排的數據中心機房和墻上那些熟悉的LOGO,就興奮起來了。



慶陽今非昔比,這里可是國家“東數西算”工程的八大樞紐節點之一。

作為“中國算谷”,慶陽的智算中心是如何應對DeepSeek帶來的新需求?老丘覺的這肯定很值得借鑒。



第二、參觀的項目不尋常——

抵達的第一站,老丘要去參觀的是燧弘華創在慶陽樞紐的綠色智算中心。

要知道,燧弘華創是首家入駐慶陽的數據中心企業,目前已經投產2萬P高端算力,而且全部售罄。



老丘心里一邊羨慕著同行,一邊近距離觀摩拍照。



參觀過程中,老丘了解到,在智算中心的落地過程中,燧弘華創在技術研發層面深耕細作。

并與聯想協同創新,基于萬全異構智算平臺,輸出融合、穩定和高效的算力。



最終,大家的目光都被數據中心前廳的一組展示設備吸引,老丘也走過去圍觀。

原來這里展示的聯想為燧弘華創定制的,搭載了燧原國產算力卡的異構智算服務器。



第三,會議的干貨不尋常——

參觀結束,接下來進入干貨滿滿的會議階段。

以前開會,老丘就是捧個場,一落座就犯困。可這次,老丘是全程豎著耳朵從頭聽到尾,而且頻頻拍照。



聯想專家的分享,講到了老丘真正關注的兩大問題。

①如何優化智算集群,滿足類似DeepSeek這樣“潑天”的推理需求。

②如何優化智算一體機,滿足DeepSeek等大模型本地化部署的需求。

這兩方面,聯想都給出了深度實踐后的最佳答案。

▌第一通過「聯想萬全異構智算平臺」提升千卡、萬卡集群的可管理性和可伸縮性。

從而更加靈活地調度算力資源,滿足模型后訓練、推理等業務對算力的新需求:突發性強、零散度高、彈性要求高。



同時,萬全異構智算平臺支持豐富的GPU、AI加速卡生態,通過“異構”,可引入不同精度的算力,滿足當下和未來推理場景對低精度算力的要求。

而且,萬全異構智算平臺還支持智算、高性能計算異構,從而讓不同精度的算力都能最大化使用。



在現場,聯想專家還實操演示了燧弘華創基于萬全異構智算平臺定制的管理平臺,142節點,1136張卡,納管、監控、調度,一氣呵成。

老丘看罷直呼內行,預訓練時代大家為了秀肌肉,總喜歡整什么萬卡、十萬卡,現在到了推理時代,把千卡優化好,效率最大化才是王道。



▌第二,用「混合精度量化」策略,提升推理速度。

其核心的原理就是:不是所有權重和激活都用同樣的精度,而是根據重要性使用不同的精度(FP16/BF16/FP8/INT8/INT4等)。

聯想可以根據不同模型的特點、智算中心算力卡的精度支持情況,為運營者制定一套推理效率最大化的量化策略。



簡單講就是在關鍵地方(離群點)保留高精度,在其他地方用低精度,配合圖結構優化和自動編譯工具,提升推理速度、減少算力消耗。

聯想給出了實測結果,經過混合精度量化的DeepSeek 32B蒸餾模型,相比原模型吞吐提升近100%,端到端延遲降低50%,且模型性能近乎無損。



▌第三通過「通信計算重疊」和「訪存優化」,來提升算力利用率(MFU)

通信計算重疊,就是在計算單元(CPU/GPU)執行當前任務的同時,后臺異步傳輸下一階段需要的數據(模型參數、中間結果等),讓通信和計算時間部分或完全重疊。

從而充分利用硬件并行能力,隱藏通信延遲,提升系統整體吞吐。



訪存優化,尤其針對長序列場景,通過分塊計算和算子融合,就近緩存數據,并采用按需重計算,顯著減少顯存開銷,降低通信延遲。

好比把大任務拆成小塊干,把常用的東西放手邊,不重要的結果就不存,等需要時再算,這樣能省很多空間,還能干活更快更流暢。



▌第四通過「內核態虛擬化」,精細化調度算力,并嚴格隔離故障。

聯想萬全異構智算平臺,還提供了一項獨門絕技:內核態虛擬化

可實現顯存1MB粒度、算力1%精度隔離,虛擬化性能損失低于3%,并具備嚴格的故障隔離性。



這波操作,讓異構智算平臺可以更細粒度地調度算力,滿足后DeepSeek時代大模型后訓練和推理對算力小快靈的需求。

比如在會議現場,老丘就親眼目睹了聯想專家用單GPU運行100個模型任務,效率跑滿,靈活性超強。



▌第五,通過極致優化,提升DeepSeek一體機吞吐,滿足本地化部署需求。

在一體機層面,聯想也下足了功夫。

聯想專家現場演示,單機8卡運行滿血版DeepSeek R1,3000并發下,極限吞吐高達8000+ TPS。



更讓老丘佩服的一點在于,聯想的一體機測試,不僅限于展示并發和極限吞吐,還提供了與真實業務場景相匹配的模擬測試。

除了最通用的聊天會話場景,還包括了代碼生成、文檔翻譯、文檔解析、知識庫應用等等,每種場景都給出了明確的指標。



就這樣,不管是智算集群優化用于大規模運營,還是一體機優化用于本地化部署,聯想都拿出了最優解。

一天的會議下來,老丘徹底想明白接下來怎么玩了。

跟著聯想走,跟著萬全異構智算的方案走,把自己手里的算力重新優化,適配推理和后訓練新需求……

2025,我又可以啦!



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
朱媛媛剛走,曹穎也自曝患癌:沒多少時間了,害怕看不到兒子長大

朱媛媛剛走,曹穎也自曝患癌:沒多少時間了,害怕看不到兒子長大

子芫伴你成長
2025-05-22 22:06:13
黃楊鈿甜母親和舅舅的官司曝光!原來做的是非法生意,舅舅被判刑

黃楊鈿甜母親和舅舅的官司曝光!原來做的是非法生意,舅舅被判刑

火山詩話
2025-05-25 07:33:22
“無兒無女”現象席卷全國,近7000萬女性終身不育,到底怎么破?

“無兒無女”現象席卷全國,近7000萬女性終身不育,到底怎么破?

青眼財經
2025-05-23 22:25:27
上海教委要求老師不得給家長布置作業,犯了一個致命性錯誤!

上海教委要求老師不得給家長布置作業,犯了一個致命性錯誤!

莊志明律師
2025-05-25 15:45:12
惠州一奔馳4S店疑似暴雷

惠州一奔馳4S店疑似暴雷

惠州客
2025-05-25 16:35:59
房價已到天花板了?專家預測5年后:大城市20000、小城市3000

房價已到天花板了?專家預測5年后:大城市20000、小城市3000

山丘樓評
2025-04-17 12:31:56
比斯利:詹姆斯百分百是歷史第一人!有人刻意掩蓋喬丹的黑點!

比斯利:詹姆斯百分百是歷史第一人!有人刻意掩蓋喬丹的黑點!

歷史第一人梅西
2025-05-25 16:13:06
鳥盡弓藏,政變余波

鳥盡弓藏,政變余波

求實處
2025-05-24 21:47:24
人社部明確,2025年養老金調整新重點,定額調整能漲10-20元嗎?

人社部明確,2025年養老金調整新重點,定額調整能漲10-20元嗎?

阿纂看事
2025-05-25 13:28:55
4張銀行卡密碼泄露,杭州一女子凌晨報警:我的250萬啊!

4張銀行卡密碼泄露,杭州一女子凌晨報警:我的250萬啊!

瀟湘晨報
2025-05-25 09:04:21
下周端午節,提醒:1不去,2不碰,3不買,4要吃,提前了解早準備

下周端午節,提醒:1不去,2不碰,3不買,4要吃,提前了解早準備

神牛
2025-05-24 14:40:01
第四次工業革命,中國幾乎所有領域都排第一,難怪美國這么慌

第四次工業革命,中國幾乎所有領域都排第一,難怪美國這么慌

顧史
2025-05-23 22:47:30
大反轉!不是母子,不是考公,不是舍不得打車

大反轉!不是母子,不是考公,不是舍不得打車

半島晨報
2025-05-25 11:27:03
劉亦菲出發去法國,她穿LV德訓鞋很青春,她戴紫色翡翠手鐲顯貴氣

劉亦菲出發去法國,她穿LV德訓鞋很青春,她戴紫色翡翠手鐲顯貴氣

夢涵說體育
2025-05-25 08:48:52
“靖康之恥”有多虐心?皇帝生母每日接客超百人,公主肛裂而死

“靖康之恥”有多虐心?皇帝生母每日接客超百人,公主肛裂而死

阿胡
2024-03-28 15:30:23
事態惡化! 全澳突發大批青少年無差別襲擊華人! 7名打人Teens被釋放! 華人團結集結, 開始反抗行動!

事態惡化! 全澳突發大批青少年無差別襲擊華人! 7名打人Teens被釋放! 華人團結集結, 開始反抗行動!

澳洲紅領巾
2025-05-25 14:30:38
66年,薄一波夫婦深夜嚴肅詢問兒子:還跟劉源玩嗎,聽完松了口氣

66年,薄一波夫婦深夜嚴肅詢問兒子:還跟劉源玩嗎,聽完松了口氣

百年人物志
2025-05-24 10:07:04
印度公布空戰戰績,擊落巴基斯坦4架F-16,直接惹怒美國!

印度公布空戰戰績,擊落巴基斯坦4架F-16,直接惹怒美國!

慢看世界
2025-05-25 11:42:30
嚇人!南京一線江景房小區從6萬降到2.5萬,一套房市值縮水300萬

嚇人!南京一線江景房小區從6萬降到2.5萬,一套房市值縮水300萬

火山詩話
2025-05-24 13:28:37
這個上海姑娘,可能是全網最后悔的人了,腸子都要悔青了

這個上海姑娘,可能是全網最后悔的人了,腸子都要悔青了

界史
2025-05-15 10:10:24
2025-05-25 19:47:00
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1003文章數 717關注度
往期回顧 全部

科技要聞

馬斯克宣布回歸7x24小時工作狀態

頭條要聞

石破茂:要求美撤銷所有附加關稅是日方堅定不移的立場

頭條要聞

石破茂:要求美撤銷所有附加關稅是日方堅定不移的立場

體育要聞

武漢女足:從大學校園,到亞洲之巔

娛樂要聞

朱媛媛只留給女兒一句話,卻字字千金

財經要聞

重組膠原測不到膠原?800億醫美巨頭回應

汽車要聞

賽博風旗艦轎車 全新小鵬P7申報信息曝光

態度原創

房產
時尚
游戲
數碼
本地

房產要聞

連續17次提前交付!海口這座頂流紅盤,業主贏麻了!

伊姐周日熱推:電視劇《陷入我們的熱戀》;電視劇《在人間》......

PS游戲陣容再迎新作:又一國產手游將登陸主機!

數碼要聞

三大套路!顯示器618最強選購指南出爐:合適比參數更重要

本地新聞

巴黎沒有倍兒甜,但天津巧克力腦袋倍兒多

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 陕西省| 崇文区| 土默特右旗| 仁布县| 中超| 舟山市| 手游| 布尔津县| 克拉玛依市| 仁化县| 公主岭市| 江阴市| 德庆县| 拉孜县| 望都县| 宝清县| 尤溪县| 公安县| 璧山县| 曲松县| 中超| 师宗县| 华阴市| 南部县| 砚山县| 合水县| 子长县| 舞钢市| 安福县| 诸城市| 横峰县| 科技| 涞水县| 道真| 崇信县| 平武县| 衡东县| 黎川县| 江华| 越西县| 苏尼特左旗|