大模型炙手可熱,不過正在形成兩大陣營。
一方面,是越來越強的云側(cè)大模型。從文生視頻的Sora,到最近在實時語音交互上令人印象深刻的GPT-4o,以及國內(nèi)上百款大模型都是這樣。在華為開發(fā)者大會2024(HDC 2024)上,華為云重磅發(fā)布的盤古大模型5.0,在多模態(tài)理解、復雜邏輯推理等方面的表現(xiàn),更是備受矚目。
另一方面,是大模型走向端側(cè)。包括華為、榮耀、OPPO、vivo等手機廠商,以及聯(lián)想等PC廠商,都推出了AI端側(cè)大模型。最近舉行的WWDC24上,蘋果也發(fā)布了本地運行的Apple Intelligence。
那么問題來了,端側(cè)大模型和云側(cè)大模型到底誰代表著未來?AI時代的發(fā)展方向到底是什么?
大模型時代的終極范式
“深度學習之父” Geoffrey Hinton曾經(jīng)暢想過這樣的場景:“會有一個階段,一旦某個AI系統(tǒng)訓練完畢,我們會將其運行在非常低功耗的系統(tǒng)上,所以,如果你想讓你的烤面包機能和你對話,你需要一個只花費幾美元的芯片,而且它能運行像ChatGPT這樣的程序。”
端側(cè)大模型之所以會出現(xiàn),歸結(jié)起來有這么幾個原因:一是云側(cè)大模型推理成本比較高;二是在端側(cè)運行的大模型可以保護數(shù)據(jù)隱私;三是在一些沒有網(wǎng)絡連接的場景下,可以使用本地算力來支持大模型的運行。IDC預測,到2026年中國市場近50%的終端設備處理器將帶有AI引擎,由此可以看到端側(cè)大模型的發(fā)展迅速。
不過,端側(cè)大模型也有其不足。IDC中國高級分析師郭天翔表示,目前端側(cè)的算力要求比較高,功耗比較大,更為重要的是端側(cè)大模型的參數(shù)量級無法和云側(cè)的通用大模型相比。縱觀市面上的大模型,相比云測大模型動輒百億、千億參數(shù),端側(cè)大模型大多參數(shù)量級比較小,如蘋果的端側(cè)大模型為30億參數(shù)。
目前業(yè)界越來越認同,端側(cè)大模型和云側(cè)大模型并不是競爭關(guān)系,而是協(xié)同關(guān)系。部分智能推理任務或者推理任務的部分階段放到端側(cè)進行處理,可以發(fā)揮端側(cè)大模型本地即時處理的優(yōu)勢,而且用戶原始數(shù)據(jù)不離開本地,可以保護數(shù)據(jù)安全隱私。同時,需要更強能力、更深思考的時候,可以使用云側(cè)大模型。雙方優(yōu)勢互補,相得益彰,最大程度地發(fā)揮端側(cè)大模型和云側(cè)大模型的優(yōu)勢。
舉個例子,如果你對某篇文章做摘要,可以使用端側(cè)大模型,而要寫一篇論文查閱該領(lǐng)域的歷史性資料,就只能使用云側(cè)大模型。IDC在預測2024年AI發(fā)展趨勢時,也將端云結(jié)合確定為其中之一,其指出端側(cè)大模型的安全性和及時性與云側(cè)大模型的豐富功能和算力將實現(xiàn)很好結(jié)合。
以華為為例,小藝背后的大模型就擁有端側(cè)和云側(cè)兩種形態(tài),可以針對不同設備和場景的需求進行處理。端側(cè)大模型會對用戶請求和上下文信息做預處理,然后將需求發(fā)到云端,最大化發(fā)揮端側(cè)的速度與云側(cè)的強大。同樣,蘋果入局大模型,也是采用端云協(xié)同的方式。
在HDC 2024上,鴻蒙原生智能(Harmony Intelligence)發(fā)布,就是采用端云協(xié)同的架構(gòu)。端側(cè)的個人數(shù)據(jù)與用戶意圖,和云側(cè)的智能中樞互相配合,高效協(xié)同。
端云協(xié)同才是大模型時代的終極范式。
端云協(xié)同的大模型,有多難?
不過,端云協(xié)同說起來容易,實際實現(xiàn)起來難度很大。
端側(cè)大模型的實現(xiàn)路徑大致是這樣的,通常是云側(cè)大模型通過剪枝、量化、蒸餾等模型壓縮和加速技術(shù),給大模型減重,然后再根據(jù)終端的特點和用戶需求進行針對性的訓練。例如,華為小藝的端側(cè)大模型就重點針對語音對話、設備操作、購物、生活常識等場景進行訓練,而且還對提示詞和輸出格式進行了壓縮,將推理時延縮短了一半。
顯然,這個過程就要求廠商對于云側(cè)大模型和端側(cè)大模型都需要有深刻理解和豐富經(jīng)驗。而且,如何將任務在兩種大模型間進行分配,如何實現(xiàn)端側(cè)和云側(cè)的良好配合,如何保護數(shù)據(jù)隱私等等,對于廠商來說都是極大的考驗。華為常務董事、終端BG董事長、智能汽車解決方案BU董事長余承東表示,華為早在2017年就開啟Mobile AI時代,持續(xù)耕耘終端AI體驗創(chuàng)新,從2018-2020年的個人終端AI化,以及2021-2022年的全場景設備AI化,到2023-2024年以AI大模型賦能終端,都是這樣。
站在這個角度看華為云,就可知其在端云協(xié)同上的獨特性。因為華為幾乎是業(yè)界唯一同時擁有云側(cè)大模型和端側(cè)大模型,以華為云作為統(tǒng)一云底座,打造了昇騰、鯤鵬、鴻蒙、歐拉、GaussDB等根技術(shù)及相關(guān)生態(tài),并實現(xiàn)領(lǐng)先的廠商。在云側(cè),早在2021年華為就發(fā)布了盤古大模型,包括NLP大模型和CV大模型,并在這幾年持續(xù)迭代,最新發(fā)布的盤古大模型5.0最大的特點是在多模態(tài)上有了突飛猛進的進步,能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高分辨率;在內(nèi)容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術(shù),聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。
在端側(cè),華為在盤古L0大模型的基礎(chǔ)上,專門針對終端消費者場景中涉及的數(shù)據(jù)進行了精細調(diào)優(yōu),構(gòu)建出一個L1的對話大模型,應用到了小藝上,小藝在端側(cè)大模型的加持下,不僅可以通過自然語言對話更聰明地理解并執(zhí)行用戶指令,而且可以實現(xiàn)文本生成、摘要總結(jié)、多語種翻譯等功能,堪稱是一個高效的生產(chǎn)力工具。同時,小藝是越用越懂你,可以通過學習不斷進步,儼然是一個私人智能助手。
在華為自主新一代盤古大模型5.0的加持下,小藝的能力也得到全面提升,擁有上萬億tokens的知識量,可以智能感知23類主要場景,提供300多種重點服務,任務推理規(guī)劃的成功率高達90%。
今年4月華為發(fā)布的華為MateBook X Pro不僅首次應用盤古大模型,還精選100+智能體,用戶可以一鍵直達豐富的AI應用。在熱銷的問界M9上,車載智慧助手小藝在AI大模型的加持下具有用車知識問答、熱點資訊總結(jié)、百科知識問答等功能,是車主用車過程中的得力助手。
在華為Mate60系列手機中備受用戶好評的AI云增強,同樣體現(xiàn)出華為云在端云協(xié)同上的能力。用戶拍攝圖片后,可以點擊圖片右上角的魔法棒圖標,從而對照片進行智能分析,并將照片上傳到云端進行優(yōu)化,提升照片的清晰度和美感度。據(jù)了解,這項突破手機硬件限制的獨特功能,背后是通過華為云KooVerse全球存算網(wǎng)調(diào)用云端強大的算力,在云端進行AI推理,從而讓用戶在手機上實現(xiàn)專業(yè)級的照片效果。
除了云拍照增強外,云助端的典型場景還有云助小藝及云手機等,云助小藝可以調(diào)用云上千萬級參數(shù)大模型,支撐千萬級用戶在線推理,語音對話、AIGC在線創(chuàng)作及個性化推薦能力全面提升;云手機場景下,通過華為云全球存算網(wǎng)讓算力在近端部署,端到端時延<150ms,全面助力鴻蒙生態(tài)的繁榮。
事實上,盤古大模型的架構(gòu)天然契合端云協(xié)同的特性。盤古大模型并不是一個大模型,而是一個大模型系列,包括“5+N+X”三層架構(gòu):L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五大基礎(chǔ)大模型,可以滿足行業(yè)場景中的多種技能需求;L1層是N個行業(yè)大模型,基于通用大模型訓練;L2層是更多細化場景的模型,場景包括政務熱線、網(wǎng)點助手、臺風路徑預測等。在HDC 2024上,可以看到盤古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務場景。十億級參數(shù)的Pangu E系列可支撐手機、PC等端側(cè)的智能應用;百億級參數(shù)的Pangu P系列,適用于低時延、高效率的推理場景;千億級參數(shù)的Pangu U系列適用于處理復雜任務;萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復雜的跨領(lǐng)域多任務。
盤古大模型的三層架構(gòu)完全解耦設計,從而可以快速適配、快速滿足行業(yè)需求。華為之所以可以快速從L0的盤古大模型訓練出L1的小藝端側(cè)大模型就是如此。
佛經(jīng)中常有“須彌納芥子”、“芥子納須彌”的說法,巨大如須彌山這樣的存在都可以放入芥子這樣微小的東西里面,意指佛法博大精深,以及修行之難。將云側(cè)大模型放到端側(cè),不也是如此嗎?不僅要放進去,而且要能滿足特定場景需求,還要實現(xiàn)云側(cè)和端側(cè)的協(xié)同配合,對廠商考驗之大可想而知。
端云協(xié)同的混合大模型才是AI的未來
總而言之,端云協(xié)同的混合大模型才是AI的未來。
混合大模型,不僅可以結(jié)合端側(cè)和云側(cè)的各自優(yōu)勢,更是可以形成一種彼此促進的飛輪效應。云側(cè)大模型可以向端側(cè)大模型輸出能力,而端側(cè)大模型可以向云側(cè)大模型反饋執(zhí)行成效和端側(cè)新知識,進而促進云側(cè)大模型不斷進化,彼此推動,飛輪越轉(zhuǎn)越快。
這種混合大模型,不僅適用于C端,更是適用于B端。實際上,企業(yè)自己的專有大模型就像手機或者PC上的端側(cè)大模型一樣,擁有更好的安全以及更低的時延。對于企業(yè)來說,混合大模型既能打消其對于數(shù)據(jù)保護的顧慮,又能兼顧大模型在能力上的優(yōu)勢。如果說手機和PC上的混合大模型加速了大模型進入尋常百姓家,那么,無疑,端云協(xié)同的大模型可以加速大模型在千行萬業(yè)上的落地。
在這方面,盤古大模型無疑具有獨特優(yōu)勢。就像華為常務董事、華為云CEO張平安所說,“一直以來,華為云盤古大模型都堅定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅克難,砥礪前行”,盤古大模型生來就是深入千行萬業(yè)的具體場景中,幫助客戶解決難題。
一方面,L0層的盤古大模型持續(xù)進化,最新發(fā)布的盤古5.0在多模態(tài)、全系列、強思維三方面進行升級,越來越強大;另一方面,從L0到L1,盤古大模型可以結(jié)合行業(yè)公開數(shù)據(jù)訓練出行業(yè)通用大模型,也可以基于行業(yè)客戶自有數(shù)據(jù)訓練出企業(yè)專有大模型;L2層則為客戶提供“開箱即用”的模型服務。不同層級的大模型也是彼此促進,形成飛輪效應。
可以預計,越來越多的企業(yè)、行業(yè)都將能在端云協(xié)同的混合大模型的加持下,加速數(shù)字化、智能化。混合大模型,必將為AI落地千行萬業(yè)按下加速鍵。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.