芥子納須彌，大模型實現(xiàn)端云協(xié)同難度有多大？

2024-06-21 19:19:48　來源: 閆躍龍

北京舉報

分享至

大模型炙手可熱，不過正在形成兩大陣營。

一方面，是越來越強的云側(cè)大模型。從文生視頻的Sora，到最近在實時語音交互上令人印象深刻的GPT-4o，以及國內(nèi)上百款大模型都是這樣。在華為開發(fā)者大會2024（HDC 2024）上，華為云重磅發(fā)布的盤古大模型5.0，在多模態(tài)理解、復雜邏輯推理等方面的表現(xiàn)，更是備受矚目。

另一方面，是大模型走向端側(cè)。包括華為、榮耀、OPPO、vivo等手機廠商，以及聯(lián)想等PC廠商，都推出了AI端側(cè)大模型。最近舉行的WWDC24上，蘋果也發(fā)布了本地運行的Apple Intelligence。

那么問題來了，端側(cè)大模型和云側(cè)大模型到底誰代表著未來？AI時代的發(fā)展方向到底是什么？

大模型時代的終極范式

“深度學習之父” Geoffrey Hinton曾經(jīng)暢想過這樣的場景：“會有一個階段，一旦某個AI系統(tǒng)訓練完畢，我們會將其運行在非常低功耗的系統(tǒng)上，所以，如果你想讓你的烤面包機能和你對話，你需要一個只花費幾美元的芯片，而且它能運行像ChatGPT這樣的程序。”

端側(cè)大模型之所以會出現(xiàn)，歸結(jié)起來有這么幾個原因：一是云側(cè)大模型推理成本比較高；二是在端側(cè)運行的大模型可以保護數(shù)據(jù)隱私；三是在一些沒有網(wǎng)絡連接的場景下，可以使用本地算力來支持大模型的運行。IDC預測，到2026年中國市場近50%的終端設備處理器將帶有AI引擎，由此可以看到端側(cè)大模型的發(fā)展迅速。

不過，端側(cè)大模型也有其不足。IDC中國高級分析師郭天翔表示，目前端側(cè)的算力要求比較高，功耗比較大，更為重要的是端側(cè)大模型的參數(shù)量級無法和云側(cè)的通用大模型相比。縱觀市面上的大模型，相比云測大模型動輒百億、千億參數(shù)，端側(cè)大模型大多參數(shù)量級比較小，如蘋果的端側(cè)大模型為30億參數(shù)。

目前業(yè)界越來越認同，端側(cè)大模型和云側(cè)大模型并不是競爭關(guān)系，而是協(xié)同關(guān)系。部分智能推理任務或者推理任務的部分階段放到端側(cè)進行處理，可以發(fā)揮端側(cè)大模型本地即時處理的優(yōu)勢，而且用戶原始數(shù)據(jù)不離開本地，可以保護數(shù)據(jù)安全隱私。同時，需要更強能力、更深思考的時候，可以使用云側(cè)大模型。雙方優(yōu)勢互補，相得益彰，最大程度地發(fā)揮端側(cè)大模型和云側(cè)大模型的優(yōu)勢。

舉個例子，如果你對某篇文章做摘要，可以使用端側(cè)大模型，而要寫一篇論文查閱該領(lǐng)域的歷史性資料，就只能使用云側(cè)大模型。IDC在預測2024年AI發(fā)展趨勢時，也將端云結(jié)合確定為其中之一，其指出端側(cè)大模型的安全性和及時性與云側(cè)大模型的豐富功能和算力將實現(xiàn)很好結(jié)合。

以華為為例，小藝背后的大模型就擁有端側(cè)和云側(cè)兩種形態(tài)，可以針對不同設備和場景的需求進行處理。端側(cè)大模型會對用戶請求和上下文信息做預處理，然后將需求發(fā)到云端，最大化發(fā)揮端側(cè)的速度與云側(cè)的強大。同樣，蘋果入局大模型，也是采用端云協(xié)同的方式。

在HDC 2024上，鴻蒙原生智能（Harmony Intelligence）發(fā)布，就是采用端云協(xié)同的架構(gòu)。端側(cè)的個人數(shù)據(jù)與用戶意圖，和云側(cè)的智能中樞互相配合，高效協(xié)同。

端云協(xié)同才是大模型時代的終極范式。

端云協(xié)同的大模型，有多難？

不過，端云協(xié)同說起來容易，實際實現(xiàn)起來難度很大。

端側(cè)大模型的實現(xiàn)路徑大致是這樣的，通常是云側(cè)大模型通過剪枝、量化、蒸餾等模型壓縮和加速技術(shù)，給大模型減重，然后再根據(jù)終端的特點和用戶需求進行針對性的訓練。例如，華為小藝的端側(cè)大模型就重點針對語音對話、設備操作、購物、生活常識等場景進行訓練，而且還對提示詞和輸出格式進行了壓縮，將推理時延縮短了一半。

顯然，這個過程就要求廠商對于云側(cè)大模型和端側(cè)大模型都需要有深刻理解和豐富經(jīng)驗。而且，如何將任務在兩種大模型間進行分配，如何實現(xiàn)端側(cè)和云側(cè)的良好配合，如何保護數(shù)據(jù)隱私等等，對于廠商來說都是極大的考驗。華為常務董事、終端BG董事長、智能汽車解決方案BU董事長余承東表示，華為早在2017年就開啟Mobile AI時代，持續(xù)耕耘終端AI體驗創(chuàng)新，從2018-2020年的個人終端AI化，以及2021-2022年的全場景設備AI化，到2023-2024年以AI大模型賦能終端，都是這樣。

站在這個角度看華為云，就可知其在端云協(xié)同上的獨特性。因為華為幾乎是業(yè)界唯一同時擁有云側(cè)大模型和端側(cè)大模型，以華為云作為統(tǒng)一云底座，打造了昇騰、鯤鵬、鴻蒙、歐拉、GaussDB等根技術(shù)及相關(guān)生態(tài)，并實現(xiàn)領(lǐng)先的廠商。在云側(cè)，早在2021年華為就發(fā)布了盤古大模型，包括NLP大模型和CV大模型，并在這幾年持續(xù)迭代，最新發(fā)布的盤古大模型5.0最大的特點是在多模態(tài)上有了突飛猛進的進步，能夠更好更精準地理解物理世界，包括文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面，可支持10K超高分辨率；在內(nèi)容生成方面，采用業(yè)界首創(chuàng)的STCG（Spatio Temporal Controllable Generation，可控時空生成）技術(shù)，聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景，可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。

在端側(cè)，華為在盤古L0大模型的基礎(chǔ)上，專門針對終端消費者場景中涉及的數(shù)據(jù)進行了精細調(diào)優(yōu)，構(gòu)建出一個L1的對話大模型，應用到了小藝上，小藝在端側(cè)大模型的加持下，不僅可以通過自然語言對話更聰明地理解并執(zhí)行用戶指令，而且可以實現(xiàn)文本生成、摘要總結(jié)、多語種翻譯等功能，堪稱是一個高效的生產(chǎn)力工具。同時，小藝是越用越懂你，可以通過學習不斷進步，儼然是一個私人智能助手。

在華為自主新一代盤古大模型5.0的加持下，小藝的能力也得到全面提升，擁有上萬億tokens的知識量，可以智能感知23類主要場景，提供300多種重點服務，任務推理規(guī)劃的成功率高達90％。

今年4月華為發(fā)布的華為MateBook X Pro不僅首次應用盤古大模型，還精選100+智能體，用戶可以一鍵直達豐富的AI應用。在熱銷的問界M9上，車載智慧助手小藝在AI大模型的加持下具有用車知識問答、熱點資訊總結(jié)、百科知識問答等功能，是車主用車過程中的得力助手。

在華為Mate60系列手機中備受用戶好評的AI云增強，同樣體現(xiàn)出華為云在端云協(xié)同上的能力。用戶拍攝圖片后，可以點擊圖片右上角的魔法棒圖標，從而對照片進行智能分析，并將照片上傳到云端進行優(yōu)化，提升照片的清晰度和美感度。據(jù)了解，這項突破手機硬件限制的獨特功能，背后是通過華為云KooVerse全球存算網(wǎng)調(diào)用云端強大的算力，在云端進行AI推理，從而讓用戶在手機上實現(xiàn)專業(yè)級的照片效果。

除了云拍照增強外，云助端的典型場景還有云助小藝及云手機等，云助小藝可以調(diào)用云上千萬級參數(shù)大模型，支撐千萬級用戶在線推理，語音對話、AIGC在線創(chuàng)作及個性化推薦能力全面提升；云手機場景下，通過華為云全球存算網(wǎng)讓算力在近端部署，端到端時延＜150ms，全面助力鴻蒙生態(tài)的繁榮。

事實上，盤古大模型的架構(gòu)天然契合端云協(xié)同的特性。盤古大模型并不是一個大模型，而是一個大模型系列，包括“5+N+X”三層架構(gòu)：L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五大基礎(chǔ)大模型，可以滿足行業(yè)場景中的多種技能需求；L1層是N個行業(yè)大模型，基于通用大模型訓練；L2層是更多細化場景的模型，場景包括政務熱線、網(wǎng)點助手、臺風路徑預測等。在HDC 2024上，可以看到盤古大模型5.0包含不同參數(shù)規(guī)格的模型，以適配不同的業(yè)務場景。十億級參數(shù)的Pangu E系列可支撐手機、PC等端側(cè)的智能應用；百億級參數(shù)的Pangu P系列，適用于低時延、高效率的推理場景；千億級參數(shù)的Pangu U系列適用于處理復雜任務；萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復雜的跨領(lǐng)域多任務。

盤古大模型的三層架構(gòu)完全解耦設計，從而可以快速適配、快速滿足行業(yè)需求。華為之所以可以快速從L0的盤古大模型訓練出L1的小藝端側(cè)大模型就是如此。

佛經(jīng)中常有“須彌納芥子”、“芥子納須彌”的說法，巨大如須彌山這樣的存在都可以放入芥子這樣微小的東西里面，意指佛法博大精深，以及修行之難。將云側(cè)大模型放到端側(cè)，不也是如此嗎？不僅要放進去，而且要能滿足特定場景需求，還要實現(xiàn)云側(cè)和端側(cè)的協(xié)同配合，對廠商考驗之大可想而知。

端云協(xié)同的混合大模型才是AI的未來

總而言之，端云協(xié)同的混合大模型才是AI的未來。

混合大模型，不僅可以結(jié)合端側(cè)和云側(cè)的各自優(yōu)勢，更是可以形成一種彼此促進的飛輪效應。云側(cè)大模型可以向端側(cè)大模型輸出能力，而端側(cè)大模型可以向云側(cè)大模型反饋執(zhí)行成效和端側(cè)新知識，進而促進云側(cè)大模型不斷進化，彼此推動，飛輪越轉(zhuǎn)越快。

這種混合大模型，不僅適用于C端，更是適用于B端。實際上，企業(yè)自己的專有大模型就像手機或者PC上的端側(cè)大模型一樣，擁有更好的安全以及更低的時延。對于企業(yè)來說，混合大模型既能打消其對于數(shù)據(jù)保護的顧慮，又能兼顧大模型在能力上的優(yōu)勢。如果說手機和PC上的混合大模型加速了大模型進入尋常百姓家，那么，無疑，端云協(xié)同的大模型可以加速大模型在千行萬業(yè)上的落地。

在這方面，盤古大模型無疑具有獨特優(yōu)勢。就像華為常務董事、華為云CEO張平安所說，“一直以來，華為云盤古大模型都堅定的聚焦行業(yè)，在解難題、做難事的道路上不斷攻堅克難，砥礪前行”，盤古大模型生來就是深入千行萬業(yè)的具體場景中，幫助客戶解決難題。

一方面，L0層的盤古大模型持續(xù)進化，最新發(fā)布的盤古5.0在多模態(tài)、全系列、強思維三方面進行升級，越來越強大；另一方面，從L0到L1，盤古大模型可以結(jié)合行業(yè)公開數(shù)據(jù)訓練出行業(yè)通用大模型，也可以基于行業(yè)客戶自有數(shù)據(jù)訓練出企業(yè)專有大模型；L2層則為客戶提供“開箱即用”的模型服務。不同層級的大模型也是彼此促進，形成飛輪效應。

可以預計，越來越多的企業(yè)、行業(yè)都將能在端云協(xié)同的混合大模型的加持下，加速數(shù)字化、智能化。混合大模型，必將為AI落地千行萬業(yè)按下加速鍵。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.