99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

芥子納須彌,大模型實現(xiàn)端云協(xié)同難度有多大?

0
分享至

大模型炙手可熱,不過正在形成兩大陣營。

一方面,是越來越強的云側(cè)大模型。從文生視頻的Sora,到最近在實時語音交互上令人印象深刻的GPT-4o,以及國內(nèi)上百款大模型都是這樣。在華為開發(fā)者大會2024(HDC 2024)上,華為云重磅發(fā)布的盤古大模型5.0,在多模態(tài)理解、復雜邏輯推理等方面的表現(xiàn),更是備受矚目。



另一方面,是大模型走向端側(cè)。包括華為、榮耀、OPPO、vivo等手機廠商,以及聯(lián)想等PC廠商,都推出了AI端側(cè)大模型。最近舉行的WWDC24上,蘋果也發(fā)布了本地運行的Apple Intelligence。

那么問題來了,端側(cè)大模型和云側(cè)大模型到底誰代表著未來?AI時代的發(fā)展方向到底是什么?

大模型時代的終極范式

“深度學習之父” Geoffrey Hinton曾經(jīng)暢想過這樣的場景:“會有一個階段,一旦某個AI系統(tǒng)訓練完畢,我們會將其運行在非常低功耗的系統(tǒng)上,所以,如果你想讓你的烤面包機能和你對話,你需要一個只花費幾美元的芯片,而且它能運行像ChatGPT這樣的程序。”

端側(cè)大模型之所以會出現(xiàn),歸結(jié)起來有這么幾個原因:一是云側(cè)大模型推理成本比較高;二是在端側(cè)運行的大模型可以保護數(shù)據(jù)隱私;三是在一些沒有網(wǎng)絡連接的場景下,可以使用本地算力來支持大模型的運行。IDC預測,到2026年中國市場近50%的終端設備處理器將帶有AI引擎,由此可以看到端側(cè)大模型的發(fā)展迅速。

不過,端側(cè)大模型也有其不足。IDC中國高級分析師郭天翔表示,目前端側(cè)的算力要求比較高,功耗比較大,更為重要的是端側(cè)大模型的參數(shù)量級無法和云側(cè)的通用大模型相比。縱觀市面上的大模型,相比云測大模型動輒百億、千億參數(shù),端側(cè)大模型大多參數(shù)量級比較小,如蘋果的端側(cè)大模型為30億參數(shù)。

目前業(yè)界越來越認同,端側(cè)大模型和云側(cè)大模型并不是競爭關(guān)系,而是協(xié)同關(guān)系。部分智能推理任務或者推理任務的部分階段放到端側(cè)進行處理,可以發(fā)揮端側(cè)大模型本地即時處理的優(yōu)勢,而且用戶原始數(shù)據(jù)不離開本地,可以保護數(shù)據(jù)安全隱私。同時,需要更強能力、更深思考的時候,可以使用云側(cè)大模型。雙方優(yōu)勢互補,相得益彰,最大程度地發(fā)揮端側(cè)大模型和云側(cè)大模型的優(yōu)勢。



舉個例子,如果你對某篇文章做摘要,可以使用端側(cè)大模型,而要寫一篇論文查閱該領(lǐng)域的歷史性資料,就只能使用云側(cè)大模型。IDC在預測2024年AI發(fā)展趨勢時,也將端云結(jié)合確定為其中之一,其指出端側(cè)大模型的安全性和及時性與云側(cè)大模型的豐富功能和算力將實現(xiàn)很好結(jié)合。

以華為為例,小藝背后的大模型就擁有端側(cè)和云側(cè)兩種形態(tài),可以針對不同設備和場景的需求進行處理。端側(cè)大模型會對用戶請求和上下文信息做預處理,然后將需求發(fā)到云端,最大化發(fā)揮端側(cè)的速度與云側(cè)的強大。同樣,蘋果入局大模型,也是采用端云協(xié)同的方式。

在HDC 2024上,鴻蒙原生智能(Harmony Intelligence)發(fā)布,就是采用端云協(xié)同的架構(gòu)。端側(cè)的個人數(shù)據(jù)與用戶意圖,和云側(cè)的智能中樞互相配合,高效協(xié)同。



端云協(xié)同才是大模型時代的終極范式。

端云協(xié)同的大模型,有多難?

不過,端云協(xié)同說起來容易,實際實現(xiàn)起來難度很大。

端側(cè)大模型的實現(xiàn)路徑大致是這樣的,通常是云側(cè)大模型通過剪枝、量化、蒸餾等模型壓縮和加速技術(shù),給大模型減重,然后再根據(jù)終端的特點和用戶需求進行針對性的訓練。例如,華為小藝的端側(cè)大模型就重點針對語音對話、設備操作、購物、生活常識等場景進行訓練,而且還對提示詞和輸出格式進行了壓縮,將推理時延縮短了一半。

顯然,這個過程就要求廠商對于云側(cè)大模型和端側(cè)大模型都需要有深刻理解和豐富經(jīng)驗。而且,如何將任務在兩種大模型間進行分配,如何實現(xiàn)端側(cè)和云側(cè)的良好配合,如何保護數(shù)據(jù)隱私等等,對于廠商來說都是極大的考驗。華為常務董事、終端BG董事長、智能汽車解決方案BU董事長余承東表示,華為早在2017年就開啟Mobile AI時代,持續(xù)耕耘終端AI體驗創(chuàng)新,從2018-2020年的個人終端AI化,以及2021-2022年的全場景設備AI化,到2023-2024年以AI大模型賦能終端,都是這樣。



站在這個角度看華為云,就可知其在端云協(xié)同上的獨特性。因為華為幾乎是業(yè)界唯一同時擁有云側(cè)大模型和端側(cè)大模型,以華為云作為統(tǒng)一云底座,打造了昇騰、鯤鵬、鴻蒙、歐拉、GaussDB等根技術(shù)及相關(guān)生態(tài),并實現(xiàn)領(lǐng)先的廠商。在云側(cè),早在2021年華為就發(fā)布了盤古大模型,包括NLP大模型和CV大模型,并在這幾年持續(xù)迭代,最新發(fā)布的盤古大模型5.0最大的特點是在多模態(tài)上有了突飛猛進的進步,能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高分辨率;在內(nèi)容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術(shù),聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。



在端側(cè),華為在盤古L0大模型的基礎(chǔ)上,專門針對終端消費者場景中涉及的數(shù)據(jù)進行了精細調(diào)優(yōu),構(gòu)建出一個L1的對話大模型,應用到了小藝上,小藝在端側(cè)大模型的加持下,不僅可以通過自然語言對話更聰明地理解并執(zhí)行用戶指令,而且可以實現(xiàn)文本生成、摘要總結(jié)、多語種翻譯等功能,堪稱是一個高效的生產(chǎn)力工具。同時,小藝是越用越懂你,可以通過學習不斷進步,儼然是一個私人智能助手。

在華為自主新一代盤古大模型5.0的加持下,小藝的能力也得到全面提升,擁有上萬億tokens的知識量,可以智能感知23類主要場景,提供300多種重點服務,任務推理規(guī)劃的成功率高達90%。



今年4月華為發(fā)布的華為MateBook X Pro不僅首次應用盤古大模型,還精選100+智能體,用戶可以一鍵直達豐富的AI應用。在熱銷的問界M9上,車載智慧助手小藝在AI大模型的加持下具有用車知識問答、熱點資訊總結(jié)、百科知識問答等功能,是車主用車過程中的得力助手。

在華為Mate60系列手機中備受用戶好評的AI云增強,同樣體現(xiàn)出華為云在端云協(xié)同上的能力。用戶拍攝圖片后,可以點擊圖片右上角的魔法棒圖標,從而對照片進行智能分析,并將照片上傳到云端進行優(yōu)化,提升照片的清晰度和美感度。據(jù)了解,這項突破手機硬件限制的獨特功能,背后是通過華為云KooVerse全球存算網(wǎng)調(diào)用云端強大的算力,在云端進行AI推理,從而讓用戶在手機上實現(xiàn)專業(yè)級的照片效果。

除了云拍照增強外,云助端的典型場景還有云助小藝及云手機等,云助小藝可以調(diào)用云上千萬級參數(shù)大模型,支撐千萬級用戶在線推理,語音對話、AIGC在線創(chuàng)作及個性化推薦能力全面提升;云手機場景下,通過華為云全球存算網(wǎng)讓算力在近端部署,端到端時延<150ms,全面助力鴻蒙生態(tài)的繁榮。

事實上,盤古大模型的架構(gòu)天然契合端云協(xié)同的特性。盤古大模型并不是一個大模型,而是一個大模型系列,包括“5+N+X”三層架構(gòu):L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五大基礎(chǔ)大模型,可以滿足行業(yè)場景中的多種技能需求;L1層是N個行業(yè)大模型,基于通用大模型訓練;L2層是更多細化場景的模型,場景包括政務熱線、網(wǎng)點助手、臺風路徑預測等。在HDC 2024上,可以看到盤古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務場景。十億級參數(shù)的Pangu E系列可支撐手機、PC等端側(cè)的智能應用;百億級參數(shù)的Pangu P系列,適用于低時延、高效率的推理場景;千億級參數(shù)的Pangu U系列適用于處理復雜任務;萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復雜的跨領(lǐng)域多任務。



盤古大模型的三層架構(gòu)完全解耦設計,從而可以快速適配、快速滿足行業(yè)需求。華為之所以可以快速從L0的盤古大模型訓練出L1的小藝端側(cè)大模型就是如此。

佛經(jīng)中常有“須彌納芥子”、“芥子納須彌”的說法,巨大如須彌山這樣的存在都可以放入芥子這樣微小的東西里面,意指佛法博大精深,以及修行之難。將云側(cè)大模型放到端側(cè),不也是如此嗎?不僅要放進去,而且要能滿足特定場景需求,還要實現(xiàn)云側(cè)和端側(cè)的協(xié)同配合,對廠商考驗之大可想而知。

端云協(xié)同的混合大模型才是AI的未來

總而言之,端云協(xié)同的混合大模型才是AI的未來。

混合大模型,不僅可以結(jié)合端側(cè)和云側(cè)的各自優(yōu)勢,更是可以形成一種彼此促進的飛輪效應。云側(cè)大模型可以向端側(cè)大模型輸出能力,而端側(cè)大模型可以向云側(cè)大模型反饋執(zhí)行成效和端側(cè)新知識,進而促進云側(cè)大模型不斷進化,彼此推動,飛輪越轉(zhuǎn)越快。

這種混合大模型,不僅適用于C端,更是適用于B端。實際上,企業(yè)自己的專有大模型就像手機或者PC上的端側(cè)大模型一樣,擁有更好的安全以及更低的時延。對于企業(yè)來說,混合大模型既能打消其對于數(shù)據(jù)保護的顧慮,又能兼顧大模型在能力上的優(yōu)勢。如果說手機和PC上的混合大模型加速了大模型進入尋常百姓家,那么,無疑,端云協(xié)同的大模型可以加速大模型在千行萬業(yè)上的落地。

在這方面,盤古大模型無疑具有獨特優(yōu)勢。就像華為常務董事、華為云CEO張平安所說,“一直以來,華為云盤古大模型都堅定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅克難,砥礪前行”,盤古大模型生來就是深入千行萬業(yè)的具體場景中,幫助客戶解決難題。



一方面,L0層的盤古大模型持續(xù)進化,最新發(fā)布的盤古5.0在多模態(tài)、全系列、強思維三方面進行升級,越來越強大;另一方面,從L0到L1,盤古大模型可以結(jié)合行業(yè)公開數(shù)據(jù)訓練出行業(yè)通用大模型,也可以基于行業(yè)客戶自有數(shù)據(jù)訓練出企業(yè)專有大模型;L2層則為客戶提供“開箱即用”的模型服務。不同層級的大模型也是彼此促進,形成飛輪效應。

可以預計,越來越多的企業(yè)、行業(yè)都將能在端云協(xié)同的混合大模型的加持下,加速數(shù)字化、智能化。混合大模型,必將為AI落地千行萬業(yè)按下加速鍵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
以色列最高明的一招,放過哈梅內(nèi)伊

以色列最高明的一招,放過哈梅內(nèi)伊

超級學爸蛋總
2025-06-14 07:51:30
1死4傷!男子鳴笛10分鐘被圍堵,撞倒碾壓現(xiàn)場市民后逃逸,目擊者發(fā)聲

1死4傷!男子鳴笛10分鐘被圍堵,撞倒碾壓現(xiàn)場市民后逃逸,目擊者發(fā)聲

新京報
2025-06-15 15:24:17
犯我者雖遠必誅!以色列連續(xù)9年暗殺復仇巴方,911后美國也學會了

犯我者雖遠必誅!以色列連續(xù)9年暗殺復仇巴方,911后美國也學會了

有歷史
2023-10-11 10:40:36
楊冪上影節(jié)宣傳《醬園弄》搶女主章子怡風頭,趙麗穎全程缺席宣傳

楊冪上影節(jié)宣傳《醬園弄》搶女主章子怡風頭,趙麗穎全程缺席宣傳

李守智
2025-06-15 11:34:18
張雪峰連麥唐尚珺:建議考研,我要是私立中學的校長,就會要你!

張雪峰連麥唐尚珺:建議考研,我要是私立中學的校長,就會要你!

趣筆談
2025-06-15 21:34:16
小米致命車禍反轉(zhuǎn)了!雷軍決定追責!

小米致命車禍反轉(zhuǎn)了!雷軍決定追責!

大佬灼見
2025-06-14 22:12:36
大冷門!中國男排0-3輸墊底隊,損失10.17分,跌出TOP20,4戰(zhàn)6分

大冷門!中國男排0-3輸墊底隊,損失10.17分,跌出TOP20,4戰(zhàn)6分

劉姚堯的文字城堡
2025-06-15 16:50:18
雷軍祝賀葉一飛:見證歷史,終于有中國人拿全場冠軍!葉一飛牛!

雷軍祝賀葉一飛:見證歷史,終于有中國人拿全場冠軍!葉一飛牛!

直播吧
2025-06-15 22:57:21
退休后這4類老人,最讓人討厭,希望你不是其中一個

退休后這4類老人,最讓人討厭,希望你不是其中一個

有故事的人
2025-06-09 06:54:06
30823人觀戰(zhàn)!蘇超上座率創(chuàng)新高,單輪或超中超,全球排第6

30823人觀戰(zhàn)!蘇超上座率創(chuàng)新高,單輪或超中超,全球排第6

奧拜爾
2025-06-15 18:10:34
離任了才敢說真話,美前駐華大使:特朗普低估中國,做錯了一件事

離任了才敢說真話,美前駐華大使:特朗普低估中國,做錯了一件事

國學璀璨
2025-06-14 14:14:58
28歲業(yè)余門將快哭了!請假來踢世俱杯卻被拜仁灌10球,僅獲5.3分

28歲業(yè)余門將快哭了!請假來踢世俱杯卻被拜仁灌10球,僅獲5.3分

我愛英超
2025-06-16 03:20:48
夫妻生活完事后,男性用紙擦一下就行了嗎?男人要注意這3件事!

夫妻生活完事后,男性用紙擦一下就行了嗎?男人要注意這3件事!

伊人河畔
2025-05-25 11:55:52
日薪八萬還哭窮哭累,你讓牛馬們怎么想?

日薪八萬還哭窮哭累,你讓牛馬們怎么想?

廖保平
2025-06-15 08:49:06
罕見!這所上海雙非大學校長由法院副院長接任,釋放什么信號

罕見!這所上海雙非大學校長由法院副院長接任,釋放什么信號

戶外小阿隋
2025-06-15 13:59:42
23歲繼承數(shù)億家產(chǎn),如今身家是王思聰十倍,顏值氣質(zhì)遠超章澤天!

23歲繼承數(shù)億家產(chǎn),如今身家是王思聰十倍,顏值氣質(zhì)遠超章澤天!

娛樂x冰淇淋
2025-06-15 15:00:06
羅帥宇媽媽開通直播,6000多人在線!回應兒子之死后,便全程沉默

羅帥宇媽媽開通直播,6000多人在線!回應兒子之死后,便全程沉默

火山詩話
2025-06-15 06:30:58
中甲12輪積分榜:榜首再度易主,前三僅有4分之差,2隊積分未上雙

中甲12輪積分榜:榜首再度易主,前三僅有4分之差,2隊積分未上雙

中超偽球迷
2025-06-15 21:42:32
科技不是第一生產(chǎn)力,自由才是

科技不是第一生產(chǎn)力,自由才是

霹靂炮
2025-06-05 22:14:24
1987年得知王芳擔任了公安部長,江青埋怨:他當了部長也不來看我

1987年得知王芳擔任了公安部長,江青埋怨:他當了部長也不來看我

靜靜地向你走來
2025-06-12 08:46:02
2025-06-16 05:23:00
閆躍龍 incentive-icons
閆躍龍
剖析互聯(lián)網(wǎng)+帶來的行業(yè)變局
1423文章數(shù) 1168關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

以伊導彈互襲三天 位于兩國之間的約旦和伊拉克遭殃

頭條要聞

以伊導彈互襲三天 位于兩國之間的約旦和伊拉克遭殃

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

朱丹重男輕女惹爭議!讓弟弟吃雞腿惹怒網(wǎng)友

財經(jīng)要聞

以伊沖突持續(xù)升級,對全球市場影響多大

汽車要聞

一汽豐田bZ5:試圖掀桌的“合資新力量”王牌

態(tài)度原創(chuàng)

藝術(shù)
手機
教育
房產(chǎn)
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

羅巍建議榮耀400系列手機用戶不貼鏡頭膜:影響拍照效果,還會導致雜音

教育要聞

高考狀元和5個AI一起寫作文,評委們能找出誰是人類嗎?

房產(chǎn)要聞

又一城購房補貼!買房就發(fā)錢,正在海南樓市瘋狂擴散!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 潮安县| 将乐县| 栖霞市| 日喀则市| 西宁市| 布尔津县| 介休市| 昌乐县| 无锡市| 华阴市| 霸州市| 涟水县| 德清县| 宁安市| 柳林县| 绥中县| 巴彦淖尔市| 兰考县| 安远县| 抚顺市| 平泉县| 清新县| 郧西县| 岱山县| 尉犁县| 南江县| 南康市| 镇巴县| 阳江市| 东台市| 保山市| 泰安市| 法库县| 乐山市| 瓦房店市| 万山特区| 井冈山市| 娄烦县| 天全县| 凌海市| 宁城县|