99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

為什么昇騰是DeepSeek的“最優解”?

0
分享至



作者 | 金旺

來源 | 科技行者

2月13日,OpenAI CEO Sam Altman公開表示,“GPT-5將會在未來幾個月發布,并將對公眾開放免費使用。”

直接跳過OpenAI o3,迎來免費版GPT-5,這與最近一段時間DeepSeek火爆全球不無關系。

作為全球大模型領域主導者,OpenAI不能失去自己的鐵王座,DeepSeek V3/R1在過去兩個月里為全球人工智能產業帶來的沖擊,讓這一領域的頭部玩家們不得不重新思考人工智能的創新節奏。

就在本周,百度創始人李彥宏在World Governments Summit 2025峰會上也談到,“每12個月,大模型的推理成本就會降低90%以上,這比以往計算機革命都要快很多。”

那么,DeepSeek究竟為人工智能產業帶來了怎樣的變化?它又需要怎樣的算力底座?

01 DeepSeek的鯰魚效應

2024年12月26日,國內一家成立僅一年多的AI團隊發布了一個名為DeepSeek V3的模型,這個模型是在14.8萬億高質量token上進行預訓練,并通過監督微調和強化學習進一步提高了模型的性能。

相較于五個月前發布的上一版本模型,這次他們采用了多頭潛在注意力 (MLA)和MoE架構,并引入了無輔助損失的負載均衡策略和多token預測訓練目標,這樣的好處是能夠實現高效推理和低成本訓練。

僅僅是在一個月后,這個團隊又發布了一個新模型,DeepSeek R1。

這次,他們僅用相當于OpenAI o1三十分之一的成本卻實現了比肩OpenAI o1的性能,尤其DeepSeek R1還以開源形式公開了它的思維鏈,這讓DeepSeek迅速火爆全球。

在這之后,我們看到,全球人工智能領域在短短一個月內經過了多次思想上的碰撞,推動了全球人工智能產業鏈的變革。



這場變革主要體現在三個方面:

第一,加速基座大模型創新。

此前,基座大模型的市場已經開始向幾家頭部AI玩家聚集,DeepSeek R1的出現,就像一條鯰魚,加快了基座大模型的競爭和創新速度。

我們不僅能看到OpenAI官方將在未來幾個月里推出免費版本的GPT-5,還看到了近期頭部AI玩家紛紛發布了性能更強的基座大模型,例如阿里發布了Qwen 2.5-Max,谷歌也發布了Gemini 2.0系列模型。

此外,頭部AI玩家紛紛加大了技術投入以維持自己的領先優勢。

例如,Meta創始人扎克伯格官宣加大2025年的AI投資,預計2025年在AI領域至少投入600-650億美元(2024年為400億美元)。

與此同時,谷歌的AI投資也將從525億美元增加到750億美元。

第二,加速應用創新。

在過去一個月里,我們看到國內四大云廠商接入了DeepSeek,看到國內三大運營商跑步接入了DeepSeek,與此同時,我們也看到在B端市場,越來越多企業正在加快接入DeepSeek。



有數據顯示,自DeepSeek R1發布后,僅僅20天內,國內外就已經有160多家企業接入了DeepSeek。

第三,加速大模型普及。

據QuestMobile統計數據顯示,DeepSeek日活躍用戶數在2月1日突破了3000萬大關,刷新了全球最快達成3000萬日活用戶榜單。

另一組來自Xsignal的數據顯示,截至2月8日,DeepSeek國內APP端日活用戶數達到了3494萬,海外APP端日活用戶數達到了3685萬,全球Web端日活更是達到4800萬,全球日活用戶總量達到1.19億。

用戶數的爆炸式增長,讓DeepSeek成為繼ChatGPT后大模型在消費市場普及的又一拐點,再次加速了大模型在消費市場的普及,以及更多大模型應用的涌現。

如果深究這場人工智能產業變革的本質,實際上是DeepSeek通過模型結構、計算通信、后訓練和推理等方面極致的工程優化,提升了算力利用率。

在這一過程中,DeepSeek的模型訓練效率提升了2~3倍,推理效率提升了5~7倍,與此同時,在整體訓練成本降低了60%的同時,模型性能提升了20%。

而在DeepSeek加速大模型技術創新和普及應用時,穩定可靠的算力底座,依舊是模型創新的根本。

02 昇騰提供的“最優解”

2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持在昇騰硬件平臺上開箱即用。



作為原生支持昇騰的DeepSeek,這時在國內已經有不少企業基于昇騰完成了DeepSeek的快速上線。

實際上,早在2024年,昇騰團隊就已經在研究并行解碼技術,這與DeepSeek V3/R1特有的多頭潛在注意力機制不謀而合。

2024年12月26日,在Deepseek-V3上線并開源后,昇騰、硅基流動與DeepSeek團隊進行了多次座談,共同研討聯合創新的機會。

在這之后,昇騰成了業界首個適配完成DeepSeek核心算法,支持DeepSeek全系模型預訓練及微調,也是國內業界唯一一個從預訓練到微調全流程適配DeepSeek的AI訓練平臺。

相關數據顯示,目前各行業已有80+企業基于昇騰快速適配/上線了DeepSeek系列模型并在對外提供服務,此外,還有20+企業在適配測試中,預計在未來兩周內全部完成上線,總體而言,國內70%的企業基于昇騰快速上線。

為什么這么多企業會選擇基于昇騰平臺來上線DeepSeek?

我們了解到,昇騰是目前進行DeepSeek部署的“最優解”。

就訓練能力而言,昇騰超節點支持DeepSeek全系模型預訓練及微調,支持DualPipe、跨節點All2All等DeepSeek核心優化技術,超大帶寬通信域更適合DeepSeek的流水線并行算法及冗余專家等能力。

DeepSeek R1是強化學習RL模型,昇騰超節點是更適合DeepSeek V3/R1的解決方案。

就推理能力而言,昇騰通過并行推理優化技術+專家負載均衡能力,助力DeepSeek模型推理吞吐性能提升30%+。

DeepSeek小專家創新架構,帶來的是通信耗時及專家負載不均挑戰,更多的小專家并行,引入極大的通信開銷,更多專家的數據負載難以均衡。

昇騰平臺通過偽EP混合并行算法,通信優化性能提升30%+,稀疏路由稠密化算法,訪存性能提升20%+,從而降低專家不均衡度,推理吞吐性能提升20%~35%。

此外,作為一個開放的AI基礎軟硬件平臺,昇騰平臺打造了Atlas系列硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能以及一站式開發平臺ModelArts等全棧產品體系,并形成了規模龐大的產業生態。



據悉,截至2024年12月31日,昇騰已發展超過60硬件合作伙伴,330萬多開發者,2500多家行業合作伙伴,并共同孵化了150多個昇騰原生硬件產品,超過5800個解決方案。

面向DeepSeek掀起的這波大模型普及的技術浪潮,目前已有30+軟硬件伙伴基于昇騰推出DeepSeek一體機方案,昇騰一體機成了支持DeepSeek系列模型快速上線,支撐客戶生產系統的“最優解”。

此外,據公開信息統計,目前昇騰正在助力20+省、25城市公共算力服務平臺啟動部署DeepSeek系列模型,全國超70%區域可獲取本地支持。

如果說ChatGPT是大模型從技術研發到產業應用的一個拐點,那么,DeepSeek可以被視為第二個拐點。

接下來,我們將會在2025年看到大模型技術競爭更加激烈,也將會看到更多大模型應用在產業,乃至消費市場中陸續落地。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
丈夫不顧反對全屋打滿了柜子,入住后才發現有多實用,太滿意了!

丈夫不顧反對全屋打滿了柜子,入住后才發現有多實用,太滿意了!

一起讀裝修
2025-06-17 17:56:53
浙江2025高考最高分736分?小道消息有多離譜,數據揭秘

浙江2025高考最高分736分?小道消息有多離譜,數據揭秘

史海流年號
2025-06-21 11:19:23
內賈德銷聲匿跡前,他留給伊朗的最后一句警告,最終還是應驗了

內賈德銷聲匿跡前,他留給伊朗的最后一句警告,最終還是應驗了

議紀史
2025-06-20 15:55:03
G3316次列車即將運營,可百姓沒欣喜卻有抱怨,更是高呼菏滬高鐵

G3316次列車即將運營,可百姓沒欣喜卻有抱怨,更是高呼菏滬高鐵

阿綏談史
2025-06-20 10:41:19
保不住了?那爾那茜被教育廳調查,官媒三問擲地有聲,恐徹底涼涼

保不住了?那爾那茜被教育廳調查,官媒三問擲地有聲,恐徹底涼涼

頭號劇委會
2025-06-20 23:45:03
CBA這5人真沒資格進國家隊,看看全隊表現和排名就知道了

CBA這5人真沒資格進國家隊,看看全隊表現和排名就知道了

大眼瞄世界
2025-06-21 10:11:49
美航母支援以色列后,解放軍上強度了!島內亂成一鍋粥

美航母支援以色列后,解放軍上強度了!島內亂成一鍋粥

紅岸衛士
2025-06-21 00:53:24
兒子被同學蓋豬肉印章,對方家長卻說是開玩笑,次日他們就后悔了

兒子被同學蓋豬肉印章,對方家長卻說是開玩笑,次日他們就后悔了

五元講堂
2025-06-17 14:38:26
欲把中國卷入沖突,這家媒體露餡了!

欲把中國卷入沖突,這家媒體露餡了!

環球時報國際
2025-06-20 22:49:25
高人指點,伊朗開竅!導彈開始攻擊以色列的高樓大廈,富人居住區

高人指點,伊朗開竅!導彈開始攻擊以色列的高樓大廈,富人居住區

游古史
2025-06-21 14:00:43
女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

馬拉松跑步健身
2025-05-29 13:53:35
專機還沒抵京,馮德萊恩定調反華,中方不許雙標,并連揮4記重拳

專機還沒抵京,馮德萊恩定調反華,中方不許雙標,并連揮4記重拳

吳欣純Deborah
2025-06-20 16:08:15
那爾那茜的哥哥,數學只考10分,鋼琴只學一年,怎么上985的?

那爾那茜的哥哥,數學只考10分,鋼琴只學一年,怎么上985的?

振華觀史
2025-06-17 23:41:21
確認了: 夫妻倆已被封禁!徹底涼涼

確認了: 夫妻倆已被封禁!徹底涼涼

天津族
2025-06-21 13:36:36
以色列醫院和鉆石大樓被擊中,發言人居然還想賣慘

以色列醫院和鉆石大樓被擊中,發言人居然還想賣慘

鐵錘簡科
2025-06-21 14:57:38
人生最怕太圓滿,莫言用一段話點醒世人

人生最怕太圓滿,莫言用一段話點醒世人

清風拂心
2025-06-19 18:30:03
曾毅因身體取消天津演唱會,知情人透露還有更嚴重的事,網友怒了

曾毅因身體取消天津演唱會,知情人透露還有更嚴重的事,網友怒了

查爾菲的筆記
2025-06-21 15:21:29
國家出手!“扁擔女孩”賬號被警方處罰,行政拘留10天,原因曝光

國家出手!“扁擔女孩”賬號被警方處罰,行政拘留10天,原因曝光

胡一舸北游
2025-06-20 16:45:49
無妻無子,身價過億,已經51歲的何炅,還能和保姆過一輩子?

無妻無子,身價過億,已經51歲的何炅,還能和保姆過一輩子?

素衣讀史
2025-05-21 15:17:44
一覺醒來,昆凌的天沒塌,但我們的青春真的晃了一下!

一覺醒來,昆凌的天沒塌,但我們的青春真的晃了一下!

小椰的奶奶
2025-06-20 14:46:58
2025-06-21 16:35:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業世界
5416文章數 527關注度
往期回顧 全部

科技要聞

Siri有救了?蘋果被曝正討論史上最大收購

頭條要聞

貴州一落馬女干部被通報搞權色交易、公器私用

頭條要聞

貴州一落馬女干部被通報搞權色交易、公器私用

體育要聞

文班品嘗水席 "很享受在中國的時光"

娛樂要聞

70歲寇振海跳舞,網友:和依萍搶飯碗

財經要聞

租金大撤退!房東正在批量跑路!

汽車要聞

扔掉"舊地圖”一汽-大眾大眾品牌要找"新大陸"

態度原創

房產
家居
游戲
本地
公開課

房產要聞

坑慘2000多人!恒大財富海南高管被曝非吸12.6億元!

家居要聞

山水之間 墨染風雨云間

《死亡擱淺2》確認出展BW2025!小島秀夫親臨現場

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 思茅市| 河南省| 江西省| 沁阳市| 师宗县| 游戏| 通许县| 旅游| 锦州市| 台州市| 类乌齐县| 彰化市| 广宗县| 乌兰浩特市| 双辽市| 西华县| 师宗县| 玉屏| 京山县| 安宁市| 介休市| 永吉县| 枣强县| 方山县| 禄劝| 古交市| 栖霞市| 临邑县| 龙川县| 香港| 龙里县| 安康市| 和顺县| 陕西省| 泰兴市| 瑞安市| 托里县| 洪江市| 普陀区| 宁陕县| 松原市|