99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

計算架構(gòu),行業(yè)AI競爭的下一個分水嶺

0
分享至



導讀:當DeepSeek被廣泛部署,AI競爭焦點已從“有沒有AI”轉(zhuǎn)向“AI用得好不好”

作者 |小葳

圖片來源|攝圖+可靈


當前,相比能否用上DeepSeek,能否用得好DeepSeek成為企業(yè)更關(guān)心的話題。

通過大幅降低大模型部署成本,DeepSeek催生了千行萬業(yè)AI應用的爆發(fā)。根據(jù)國家數(shù)據(jù)局透露的數(shù)據(jù),2024年初中國日均Token消耗量為1千億,今年3月中國日均Token消耗量已經(jīng)達到10萬億級,1年時間增長了100倍。

當越來越多企業(yè)把DeepSeek等深度推理模型部署到生產(chǎn)環(huán)境,算法層面的差距迅速收窄,各行業(yè)AI競爭焦點從“有沒有AI”轉(zhuǎn)向“AI用得好不好”。2025年,模型優(yōu)化技術(shù)已經(jīng)從模型層面算法優(yōu)化,下探到底層硬件資源的極致利用。一場關(guān)乎底層軟硬件協(xié)同效能的深水區(qū)競賽悄然啟幕。

在AI基礎(chǔ)設施中,連接底層硬件和上層AI框架的計算架構(gòu),成為下一階段AI落地的關(guān)鍵。深度開放的昇騰計算架構(gòu)CANN,正成為撬動產(chǎn)業(yè)AI高效落地的新支點。



趨勢之變:AI競爭已下沉至“系統(tǒng)效能”深水區(qū)

DeepSeek模型領(lǐng)先的背后,是一系列模型結(jié)構(gòu)優(yōu)化技術(shù),包括MoE、動態(tài)稀疏計算、自適應參數(shù)優(yōu)化、多頭潛在注意力機制(MLA)、無輔助損失的負載均衡技術(shù)、多詞元預測訓練方法等。正是這些技術(shù)創(chuàng)新打破了AI訓練燒錢的魔咒,以GPT-4 百分之一的成本實現(xiàn)相近性能,同時進一步降低了AI應用門檻。

所有接入DeepSeek的企業(yè)都可以直接承接這些最先進的模型結(jié)構(gòu)優(yōu)化技術(shù),獲得同樣的加持。但是,想要讓這些技術(shù)的價值發(fā)揮到最大,更進一步提升推理效率,就必須依賴底層資源的系統(tǒng)性優(yōu)化。這就不得不提到計算產(chǎn)業(yè)的護城河——計算架構(gòu)。



如果把AI技術(shù)棧比作一塊多層蛋糕,自下而上分別是:XPU硬件層——驅(qū)動層——計算架構(gòu)層——AI框架層——AI模型層——AI應用層。計算架構(gòu)起到承上啟下的關(guān)鍵作用。向下,兼容GPU、NPU、XPU等異構(gòu)處理器;向上,對接主流AI框架,計算架構(gòu)是發(fā)揮底層硬件計算效率、使能前沿開發(fā)的關(guān)鍵平臺。

底層的計算架構(gòu)與上層的AI應用之間看似遙遠,其實計算架構(gòu)是下一節(jié)點千行萬業(yè)比拼AI應用效率的關(guān)鍵。計算架構(gòu)就像建筑地基,只有地基挖的夠深,才能支撐起更高更穩(wěn)的摩天大樓。

在全球計算產(chǎn)業(yè),有實力做計算架構(gòu)、并逐步發(fā)展出生態(tài)的企業(yè)屈指可數(shù)。計算架構(gòu)往往涵蓋編程語言、算子庫、編譯器等核心組件,以及圍繞這些組件的大量底層優(yōu)化技術(shù),每一項都需要巨量的研發(fā)投入才能持續(xù)保持技術(shù)領(lǐng)先性。

在全球AI版圖中,昇騰早已成為不可忽視的AI創(chuàng)新力量。昇騰異構(gòu)計算架構(gòu)CANN(Compute Architecture for Neural Networks)就是昇騰AI的核心軟件平臺。

一方面,CANN可以將底層昇騰全系列硬件的性能發(fā)揮到極致,大幅優(yōu)化頂尖模型的性能,加速千行萬業(yè)AI落地效率。

另一方面,通過深度開放戰(zhàn)略,CANN也為深度AI開發(fā)者提供前沿創(chuàng)新的空間,聯(lián)合伙伴勇闖模型性能的無人區(qū),成為聚合AI產(chǎn)業(yè)創(chuàng)新的引擎。通過與全球AI產(chǎn)業(yè)鏈的深度嵌入,CANN深度開放戰(zhàn)略的價值還在不斷放大。



昇騰AI基礎(chǔ)軟硬件平臺

軟硬協(xié)同+分層開放,攻堅千行萬業(yè)AI落地痛點

面對千行萬業(yè)的AI應用場景,當基于上層算法優(yōu)化的模型性能摸高已經(jīng)做到極致,想進一步提升推理效能,計算架構(gòu)可以發(fā)揮的創(chuàng)新空間非常大。目前,昇騰CANN已經(jīng)探索出一整套底層資源優(yōu)化策略和方法論,能夠大幅提升算力利用效率和模型效率,并且已經(jīng)在互聯(lián)網(wǎng)、運營商、教育科研、制造等眾多行業(yè)得到成功驗證。

第一, 針對極致性能、超低時延等場景的底層資源整體優(yōu)化

在AI應用過程中,企業(yè)對于更高性能、更低時延的需求是無止境的,尤其是擁有海量用戶、業(yè)務呈現(xiàn)高吞吐高并發(fā)的互聯(lián)網(wǎng)、運營商等行業(yè)。透過硬件資源三大件:計算、通信、內(nèi)存,CANN能夠大幅提升底層資源優(yōu)化利用率。

在計算層面,多頭潛在注意力(MLA)的前處理階段涉及20次數(shù)據(jù)搬入搬出以及13個算子串行計算。CANN創(chuàng)新提出MLAPO融合算子技術(shù),將眾多小算子融合成一個大算子,能夠?qū)⒂嬎愫臅r從109微秒降到45微秒。該技術(shù)已經(jīng)在頭部互聯(lián)網(wǎng)和運營商客戶落地,并帶來20%的性能提升。

在通信層面,MoE模型涉及專家間大量通信,CANN通過NPU Direct通信算法創(chuàng)新,讓通信時間消耗相比傳統(tǒng)RDMA異步通信降低90%。該技術(shù)已經(jīng)幫助科大訊飛星火大模型的跨機通信時延驟降90%,中國移動的千卡集群通信效率提升50%。

在內(nèi)存層面,CANN自研的多重地址映射技術(shù),通過重組碎片內(nèi)存,實現(xiàn)內(nèi)存利用率提升20%。



第二,針對AI前沿開發(fā)領(lǐng)域,CANN通過分層開放,解決開發(fā)效率和適配難題

教育/科研行業(yè)是AI前沿開發(fā)的主力軍,但往往面臨開發(fā)效率低、異構(gòu)資源適配難等痛點。普通開發(fā)者只需簡單調(diào)用算子庫即可滿足一般開發(fā)需求,但是更前沿更深度的開發(fā)需求,就需要計算架構(gòu)不斷開源開放來實現(xiàn)。

分層開放是CANN最重要的技術(shù)策略之一。在開源了Ascend C編程語言,AOL算子加速庫、HCCL集合通信庫之后,今年CANN進一步開源GE圖引擎,開放畢昇編譯器和Runtime運行時,滿足發(fā)燒友極致開發(fā)的需求。清華大學計圖團隊基于CANN構(gòu)建起了MoE專用的算子體系,率先實現(xiàn)了基于昇騰單臺服務器布局DeepSeek R1模型的突破。

此外,提供成熟的工具提升開發(fā)效率也一直是CANN迭代的重點。今年CANN新推出了CATLASS算子模板庫,提供了豐富的算子樣例。華南理工大學團隊借助CATLASS算子模板庫開發(fā)Matmul算子,開發(fā)周期從傳統(tǒng)4人周壓縮至2人周。



CANN分層開放

第三,針對本地化部署AI困難的傳統(tǒng)行業(yè),CANN聯(lián)合伙伴加速行業(yè)解決方案落地

對于制造、醫(yī)療等傳統(tǒng)行業(yè),DeepSeek落地仍有一定門檻。以DeepSeek一體機、垂直行業(yè)大模型等為代表的落地方案,能簡化部署流程,加速AI在傳統(tǒng)行業(yè)應用。昇騰聯(lián)合伙伴推出了豐富的DeepSeek解決方案,目前已經(jīng)在500+行業(yè)客戶落地。



比如在家紡行業(yè),傳統(tǒng)的畫稿設計流程過長,是影響新品研發(fā)效率的瓶頸。過去,從設計師手繪、面料選擇、樣本制作、樣品拍攝,耗時20+天,還要反復修改。昇騰伙伴紡知云科技基于CANN深度開放能力和DeepSeek底層能力,研發(fā)出國內(nèi)首個家紡大模型。設計師只需輸入簡單圖片和描述,家紡大模型會自動生成兼具美學價值和商業(yè)價值的樣品設計,將設計成本從數(shù)萬元降到幾十元,設計周期從20天減少到5天。



生態(tài)開放,聚合AI全產(chǎn)業(yè)鏈創(chuàng)新引擎

隨著AI技術(shù)不斷加速迭代,AI產(chǎn)業(yè)鏈上下游日趨龐大與復雜,決非一家或幾家科技巨頭可以覆蓋。開放的深度和廣度也正是計算架構(gòu)的核心競爭力。對于CANN,深度開放既是技術(shù)策略,也是生態(tài)戰(zhàn)略。借助深度開放,CANN正逐漸成為聚合AI全產(chǎn)業(yè)鏈創(chuàng)新力量的引擎。

首先,與伙伴攜手打造覆蓋AI落地全生命周期的、更加開放易用AI基礎(chǔ)設施生態(tài)

比如,在算子開發(fā)層面,基于CANN的深度開放能力,高性能算子庫已使能30余家客戶/伙伴開發(fā)了260+核心算子。這些核心算子適配更廣泛的行業(yè)場景,進一步降低企業(yè)AI應用門檻。

在操作系統(tǒng)層面,CANN聯(lián)合伙伴打通與鴻蒙、歐拉、麒麟等五大國產(chǎn)系統(tǒng)的深度兼容。

在模型訓練/部署層面,CANN使能騰訊、硅基流動、無問芯穹等10余家AI基礎(chǔ)設施企業(yè),打造智能調(diào)度引擎、分布式訓練框架等創(chuàng)新套件,讓AI落地更高效。

其次,與伙伴聯(lián)合研發(fā),共同推進基礎(chǔ)模型前沿創(chuàng)新

近年來,基礎(chǔ)模型的性能突破與底層資源優(yōu)化,呈現(xiàn)出雙向驅(qū)動的發(fā)展趨勢。

以昇騰與科大訊飛的深度合作為例,一方面,計算架構(gòu)加速了對模型性能的極致探索。比如,基于深度開放的CANN,科大訊飛率先實現(xiàn)了基于昇騰的MoE模型訓練推理的落地應用,在昇騰集群上實現(xiàn)MoE模型的大規(guī)模專家并行推理的首次規(guī)模化驗證,達成整體吞吐提升3.2倍,端到端時延降低50%。

另一方面,模型性能突破過程中也提升了底層軟硬件協(xié)同。比如科大訊飛也深入?yún)⑴c到了昇騰的軟件生態(tài)建設中,推動了昇騰開發(fā)工具集特性不斷豐富。

第三,持續(xù)加強與Pytorch、vLLM等全球主流AI開源生態(tài)合作

近年來,昇騰不斷加強與第三方開源生態(tài)的合作,深度嵌入全球AI開源生態(tài)。目前,vLLM已經(jīng)成為最受開發(fā)者歡迎的推理引擎之一。2024年下半年,昇騰開始與vLLM開展技術(shù)和生態(tài)合作。vLLM社區(qū)新版本發(fā)布即支持昇騰,為開發(fā)者提供更多選擇。昇騰團隊還協(xié)助vLLM社區(qū)開發(fā)了硬件后端的插件化特性,降低社區(qū)對后端支持的維護成本。

結(jié)語

當模型性能突破與底層資源優(yōu)化日益融合,計算架構(gòu)已經(jīng)從技術(shù)幕后走到產(chǎn)業(yè)臺前。

從架構(gòu)師腦中不斷迭代的代碼,到真實業(yè)務場景中的降本增效,CANN已經(jīng)在千行萬業(yè)的AI競速中發(fā)揮著舉足輕重的價值。

當企業(yè)AI應用步入深水區(qū),開放創(chuàng)新的CANN,正在成為自主可控AI產(chǎn)業(yè)鏈的中流砥柱。

本文為「智能進化論」原創(chuàng)作品。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
盧女士的事火到國外!外國美女主持人稱,這是對底層人尊嚴的踐踏

盧女士的事火到國外!外國美女主持人稱,這是對底層人尊嚴的踐踏

明月雜談
2025-07-16 20:11:33
我調(diào)任市委書記以后,去見了已經(jīng)是老板的初戀,她嘲笑我是窮光蛋

我調(diào)任市委書記以后,去見了已經(jīng)是老板的初戀,她嘲笑我是窮光蛋

喬生桂
2025-07-12 18:10:15
內(nèi)馬爾復出就絕殺!一頭臟辮跪地慶祝,星二代首秀,親爹入獄9年

內(nèi)馬爾復出就絕殺!一頭臟辮跪地慶祝,星二代首秀,親爹入獄9年

念洲
2025-07-17 09:17:25
工行男高管舉報妻子出軌后續(xù):妻子正臉照曝光,小三男被扒很亂

工行男高管舉報妻子出軌后續(xù):妻子正臉照曝光,小三男被扒很亂

奇思妙想草葉君
2025-07-16 12:10:18
美考慮援烏射程1000公里巡航導彈,特朗普:莫斯科不能打

美考慮援烏射程1000公里巡航導彈,特朗普:莫斯科不能打

文匯報
2025-07-16 23:54:20
宗慶后和杜女士的婚姻,受中國法律認可嗎?

宗慶后和杜女士的婚姻,受中國法律認可嗎?

新浪財經(jīng)
2025-07-16 17:53:54
持有娃哈哈46%股權(quán)的杭州國資委,為何一直保持沉默?

持有娃哈哈46%股權(quán)的杭州國資委,為何一直保持沉默?

互聯(lián)網(wǎng)大觀
2025-07-16 18:05:45
美國貿(mào)易政策|假如美國退出WTO

美國貿(mào)易政策|假如美國退出WTO

澎湃新聞
2025-07-16 10:22:27
宗氏三兄妹在港起訴宗馥莉文書曝光 法院指令:被告需說明轉(zhuǎn)出的108.5萬美元下落

宗氏三兄妹在港起訴宗馥莉文書曝光 法院指令:被告需說明轉(zhuǎn)出的108.5萬美元下落

每日經(jīng)濟新聞
2025-07-17 08:19:15
吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕上演

吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕上演

查爾菲的筆記
2025-07-17 00:35:02
來真的!利物浦殺瘋了:已正式與皇馬談判 報價1億歐求購24歲巨星

來真的!利物浦殺瘋了:已正式與皇馬談判 報價1億歐求購24歲巨星

風過鄉(xiāng)
2025-07-17 07:53:34
伊朗女間諜身份曝光!與120名高官發(fā)生過關(guān)系,大量情報泄露

伊朗女間諜身份曝光!與120名高官發(fā)生過關(guān)系,大量情報泄露

小嵩
2025-07-16 15:16:07
知情者曝宗慶后有7個孩子,除宗馥莉外還有6個,孩子母親身份曝光

知情者曝宗慶后有7個孩子,除宗馥莉外還有6個,孩子母親身份曝光

180視角
2025-07-16 23:29:25
董璇與高云翔現(xiàn)狀差距大:一個嫁給中戲校草,一個真被寧靜說中了

董璇與高云翔現(xiàn)狀差距大:一個嫁給中戲校草,一個真被寧靜說中了

小丸子的娛樂圈
2025-07-16 22:11:07
不顧中國,印尼跟美國簽了,轉(zhuǎn)頭發(fā)現(xiàn)美財長喊話:中國有美國要的

不顧中國,印尼跟美國簽了,轉(zhuǎn)頭發(fā)現(xiàn)美財長喊話:中國有美國要的

掌青說歷史
2025-07-16 15:30:13
中介自曝:2025最忙幫中產(chǎn)回國!百萬人逃離歐美澳,綠卡不香了?

中介自曝:2025最忙幫中產(chǎn)回國!百萬人逃離歐美澳,綠卡不香了?

毒sir財經(jīng)
2025-07-15 16:28:36
頭皮發(fā)麻!有人家中出現(xiàn)“巨型蟑螂”,網(wǎng)友:看起來有1米長

頭皮發(fā)麻!有人家中出現(xiàn)“巨型蟑螂”,網(wǎng)友:看起來有1米長

極目新聞
2025-07-15 21:20:15
熱身賽:中國男籃2分惜敗荷蘭 上半場領(lǐng)先16分被逆轉(zhuǎn)王俊杰丟絕平

熱身賽:中國男籃2分惜敗荷蘭 上半場領(lǐng)先16分被逆轉(zhuǎn)王俊杰丟絕平

醉臥浮生
2025-07-17 08:13:29
當“整容臉”混進央視緝毒劇,演技再好也拉胯,觀眾直呼:太辣眼

當“整容臉”混進央視緝毒劇,演技再好也拉胯,觀眾直呼:太辣眼

坊聞本尊
2025-07-16 17:06:31
娃哈哈財產(chǎn)爭奪迎來反轉(zhuǎn)!原來是宗馥莉先下手的,大小姐真不簡單

娃哈哈財產(chǎn)爭奪迎來反轉(zhuǎn)!原來是宗馥莉先下手的,大小姐真不簡單

探源歷史
2025-07-16 14:23:45
2025-07-17 10:39:00
智能進化論 incentive-icons
智能進化論
關(guān)注AI產(chǎn)業(yè)趨勢、場景應用
374文章數(shù) 68關(guān)注度
往期回顧 全部

科技要聞

不只H20?黃仁勛:希望對華銷售更好的芯片

頭條要聞

特朗普宣布終止資助美國高鐵:耗費數(shù)千億美元無法交付

頭條要聞

特朗普宣布終止資助美國高鐵:耗費數(shù)千億美元無法交付

體育要聞

不給楊瀚森傳球,他有自己的理由

娛樂要聞

都美竹將參加綜藝,單身媽媽發(fā)文抵制

財經(jīng)要聞

宗氏三兄妹在港起訴宗馥莉文書曝光

汽車要聞

8月初上市 長安第三代UNI-V勁擎型嘗鮮價11.49萬

態(tài)度原創(chuàng)

健康
藝術(shù)
教育
親子
軍事航空

呼吸科專家破解呼吸道九大謠言!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

3844人!2025博后資助B檔、C檔獲選結(jié)果公布

親子要聞

行~女兒在爸爸懷里撒嬌要玩具,爸爸不語,只是一味說“行” #睡個好覺

軍事要聞

胡塞武裝稱襲擊以色列多處目標 致其“航班中斷”

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 南和县| 新乡市| 巫溪县| 加查县| 社会| 绥芬河市| 泽普县| 扎赉特旗| 云和县| 淅川县| 兴文县| 巍山| 武定县| 金沙县| 内乡县| 土默特左旗| 桐柏县| 甘孜| 云霄县| 南华县| 印江| 株洲县| 胶州市| 金堂县| 达日县| 东方市| 龙岩市| 郧西县| 玛纳斯县| 普兰店市| 门源| 苏州市| 辰溪县| 炉霍县| 加查县| 阿坝| 象山县| 且末县| 北流市| 青阳县| 宁城县|