智東西
作者 云鵬
編輯 心緣
手機(jī)AI芯片大戰(zhàn),正成為今天科技賽場(chǎng)上極為重要的一場(chǎng)較量。
從手機(jī)芯片大廠到手機(jī)終端巨頭,無一不在力挺端側(cè)AI,不論是系統(tǒng)級(jí)還是個(gè)性化AI的實(shí)現(xiàn),都離不開AI的端側(cè)計(jì)算,而計(jì)算就離不開芯片。
尤其結(jié)合當(dāng)下AI智能體、AI OS方向成為行業(yè)共識(shí),AI對(duì)芯片能力的需求愈發(fā)高漲,這種需求不是簡(jiǎn)單的“TOPS”算力,而是對(duì)芯片全方位能力的考驗(yàn)。
放眼國(guó)內(nèi),小米掏出自研SoC大招,玄戒O1首秀即在CPU、GPU性能方面與高通聯(lián)發(fā)科掰手腕,與蘋果A18 Pro較量互有勝負(fù)。據(jù)小米方面透露,其自研NPU架構(gòu)也實(shí)現(xiàn)了不少細(xì)節(jié)創(chuàng)新。
▲5月22日小米發(fā)布玄戒O1自研芯片
華為海思的麒麟手機(jī)芯片雖仍然受限于工藝制程,卻在架構(gòu)和軟件系統(tǒng)層面尋找突破口,自研泰山大小核徹底擺脫Arm架構(gòu),基于自研鴻蒙操作系統(tǒng)的深度優(yōu)化連年實(shí)現(xiàn)整機(jī)性能的提升,AI功能落地速度甚至部分超過安卓旗艦機(jī)。
▲6月20日華為開發(fā)者大會(huì)(HDC)上展示的最新手機(jī)端側(cè)AI功能,AI可以幫助用戶在拍照時(shí)進(jìn)行輔助構(gòu)圖
放眼全球,蘋果芯片在硬件性能方面已經(jīng)遇到不少有力挑戰(zhàn)者,在AI掉隊(duì)之下,如何基于芯片和系統(tǒng)優(yōu)勢(shì)實(shí)現(xiàn)AI體驗(yàn)是蘋果當(dāng)務(wù)之急;三星3nm工藝被曝良率堪憂,自家Exynos旗艦芯遲遲未能量產(chǎn)落地,內(nèi)部團(tuán)隊(duì)動(dòng)蕩,但其多年技術(shù)積累令其仍然是AI手機(jī)時(shí)代不可忽視的一股芯片力量。
在終端大廠加碼布局自研芯片之時(shí),高通、聯(lián)發(fā)科自然也感受到了壓力,高通自研Oryon架構(gòu)CPU進(jìn)一步實(shí)現(xiàn)能效比的提升,聯(lián)發(fā)科連放AI開發(fā)工具大招力求用完善生態(tài)吸引AI開發(fā)者。
▲2024年10月21日高通發(fā)布采用Oryon CPU的旗艦SoC驍龍8 Elite
縱觀行業(yè),雖說做手機(jī)不一定是“得芯片者得天下”,但在AI手機(jī)時(shí)代強(qiáng)化對(duì)芯片技術(shù)的掌控,已悄然成為巨頭們的必然選擇。
▲六大主流手機(jī)AI芯片廠商旗艦SoC及工藝情況
從工藝制程到芯片架構(gòu),再到基于芯片的AI開發(fā)生態(tài),如今各家有哪些關(guān)鍵動(dòng)作和布局,又有哪些臺(tái)上臺(tái)下的精彩較量?我們嘗試在這場(chǎng)AI芯片手機(jī)大戰(zhàn)中洞察到更多關(guān)鍵趨勢(shì)。
一、2nm被蘋果搶先包圓,小米高通聯(lián)發(fā)科們要靠什么打贏“能效比”?
為何芯片對(duì)AI手機(jī)的體驗(yàn)如此重要?性能和功耗表現(xiàn)可以說是一切功能想要真正落地前都必須要邁過的一道坎。
對(duì)于移動(dòng)智能設(shè)備來說,PPT中漂亮AI功能的實(shí)現(xiàn),前提都是不能以犧牲手機(jī)功耗、續(xù)航為基礎(chǔ),這是一條絕對(duì)的“紅線”。
十幾年來,提升芯片能效一直是智能手機(jī)芯片行業(yè)迭代的重點(diǎn),而在AI手機(jī)時(shí)代,這一需求顯得更為迫切。
從工藝制程到芯片架構(gòu)設(shè)計(jì),各家的競(jìng)爭(zhēng)態(tài)勢(shì)愈發(fā)激烈。
工藝方面,如今旗艦手機(jī)SoC的工藝制程已經(jīng)普遍來到了第二代3nm階段,包括蘋果、高通、聯(lián)發(fā)科、小米。當(dāng)然,蘋果每年都會(huì)率先包圓臺(tái)積電最新最強(qiáng)的工藝,比如明年的2nm。
蘋果分析師Jeff Pu提到,A19 Pro芯片會(huì)采用臺(tái)積電第三代3nm制程,蘋果最快會(huì)在明年的iPhone 18系列上引入臺(tái)積電2nm工藝。
臺(tái)積電董事長(zhǎng)魏哲家在財(cái)報(bào)電話會(huì)上曾透露,臺(tái)積電寶山廠首批2nm產(chǎn)能已經(jīng)全部被蘋果包圓了。
高通、聯(lián)發(fā)科、小米雖然不是第一批,但目前的旗艦芯片也都用上了蘋果“同款”工藝,三星這邊雖然自家集團(tuán)中的半導(dǎo)體部門有著先進(jìn)工藝制程技術(shù),但在量產(chǎn)和內(nèi)部管理方面卻頻頻“翻車”,甚至原計(jì)劃的3nm Exynos系列芯片直接難產(chǎn)。
就在最近,三星的芯片業(yè)務(wù)被曝出偽造數(shù)據(jù)、掩蓋缺陷的丑聞,據(jù)報(bào)道,三星芯片工程師也紛紛跳槽到對(duì)家,可以說是“屋漏偏逢連夜雨”。
相比三星工藝翻車,華為海思這邊則是承壓前行,由于代工受到限制,麒麟手機(jī)芯片無法用上最新工藝制程,在芯片能效比提升方面與同代采用新工藝的旗艦芯片會(huì)拉開一定差距,操作系統(tǒng)和軟件層面的優(yōu)化對(duì)整機(jī)性能提升貢獻(xiàn)較大。
▲ CPU多核能效曲線(紅色圓點(diǎn)為麒麟9020,紫色、綠色曲線為高通、聯(lián)發(fā)科旗艦芯,時(shí)間為2024年12月),來源:極客灣Geekerwan
整體來看,工藝制程的升級(jí)對(duì)芯片能效的提升固然十分重要,但工藝制程的進(jìn)步在明顯放緩,手機(jī)能效比如果想要實(shí)現(xiàn)顛覆性提升,不能僅憑工藝升級(jí)。
臺(tái)積電在2024年的IEDM會(huì)議上提到,同面積2nm芯片的晶體管數(shù)量比3nm芯片多15%,同功耗下芯片性能提升大約15%。
在工藝之外,芯片設(shè)計(jì)層面、架構(gòu)層面等更多廠商可自主把控環(huán)節(jié)的技術(shù)創(chuàng)新就顯得更為重要,這也是各家能夠形成差異的一部分。
二、巨頭死磕自研架構(gòu),芯片設(shè)計(jì)掀起“真假自研大戰(zhàn)”
業(yè)內(nèi)普遍認(rèn)為,在做AI手機(jī)這事上,蘋果有著軟硬件打通的先天優(yōu)勢(shì)——越深度全面地掌握底層技術(shù),就越容易最終實(shí)現(xiàn)整機(jī)更好的體驗(yàn)。
各家手機(jī)AI芯片的自研深度或許決定著其AI手機(jī)體驗(yàn)的上限天花板。
雖然自研芯片的優(yōu)勢(shì)不是絕對(duì)的,但強(qiáng)化對(duì)自研芯片技術(shù)的掌握,已經(jīng)成為目前手機(jī)芯片領(lǐng)域毋庸置疑的大勢(shì)所趨。
具體來看,各家手機(jī)AI芯片自研模式有所不同,蘋果、華為、高通,基于Arm指令集,在SoC所有核心模塊實(shí)現(xiàn)自研;聯(lián)發(fā)科、小米、三星,基于Arm指令集,采用Arm公版架構(gòu)+部分模塊自研。
當(dāng)然,不論是哪種模式,都是毫無疑問的“自研”。簡(jiǎn)單來說,Arm指令集就像是芯片說的“語言”,但兩個(gè)人即便都用同樣的語言來寫文章,也會(huì)有“大學(xué)生論文”和“小學(xué)生作文”的差別。
蘋果這邊的自研深度自然不必多說,甚至可以說是“斷檔式領(lǐng)先”。
深度自研在AI方面實(shí)則能帶來不少優(yōu)勢(shì),比如蘋果芯片的GPU模塊可以針對(duì)圖形處理和AI計(jì)算進(jìn)行優(yōu)化,其神經(jīng)網(wǎng)絡(luò)引擎(NPU)更是蘋果獨(dú)特優(yōu)勢(shì),對(duì)端側(cè)AI各類功能加速都進(jìn)行了深度優(yōu)化。
華為雖然芯片工藝受限,但麒麟芯片的架構(gòu)卻一直在持續(xù)迭代。據(jù)了解,在最新的麒麟9020這一代上,華為已經(jīng)實(shí)現(xiàn)了CPU全部核心替換為自研泰山架構(gòu),從超大核到小核。而GPU方面也有其自研的馬良系列。
▲華為麒麟9020芯片CPU內(nèi)核情況,來源:極客灣Geekerwan
實(shí)際上,華為也是在麒麟9020這一代上才實(shí)現(xiàn)的完全核心模塊自研,此前9010的CPU小核依然用的Arm公版IP。
在AI手機(jī)這波浪潮中,華為是手機(jī)行業(yè)中第一個(gè)將大模型能力用在手機(jī)上,實(shí)現(xiàn)自家智能助手升級(jí)的廠商,其自研麒麟芯片和自研鴻蒙操作系統(tǒng)的深度協(xié)同,讓華為即使在工藝制程受限的情況下,每年也能穩(wěn)定實(shí)現(xiàn)一定的整機(jī)性能提升,這對(duì)于AI體驗(yàn)的落地也十分關(guān)鍵。
相較于蘋果華為這種“自產(chǎn)自銷”的廠商,高通作為三方芯片廠商,其自研芯片的特性多少會(huì)一定程度上掣肘于安卓系統(tǒng)。
目前高通自研Oryon CPU已經(jīng)迭代至第二代,并大規(guī)模量產(chǎn)應(yīng)用在旗艦手機(jī)中,其自研的Adreno GPU也做了十幾年。
Oryon CPU架構(gòu)的突破,幫高通在CPU單核、多核性能上都領(lǐng)先于同代聯(lián)發(fā)科旗艦SoC,在手機(jī)CPU能效方面穩(wěn)居第一梯隊(duì)。
高通自研的Hexagon NPU,最新一代AI算力突破了80TOPS,據(jù)稱今年即將突破100TOPS,從算力絕對(duì)值層面來說,高通自研NPU有比較明顯的優(yōu)勢(shì)。
聯(lián)發(fā)科、小米的CPU、GPU核心模塊都是基于Arm IP授權(quán)進(jìn)行定制設(shè)計(jì),均為Arm架構(gòu);三星的Exynos CPU雖然是Arm架構(gòu),但GPU卻采用了AMD的RDNA 3架構(gòu)。
▲小米玄戒O1 CPU內(nèi)核,來源:小米
ISP和NPU沒有“公版”之說,因此各家都是自研定制,比如ISP方面聯(lián)發(fā)科的Imagiq、小米的自研ISP;聯(lián)發(fā)科旗艦芯NPU有42TOPS算力,小米也有自研6核NPU。
前段時(shí)間關(guān)于芯片“自研”的討論成為科技圈第一大話題,實(shí)際上,正如前文所說,芯片自研與否與是否采用了Arm架構(gòu)或Arm IP授權(quán)并無直接關(guān)系。
一個(gè)手機(jī)SoC里面包含上百個(gè)IP模塊,如何讓各個(gè)模塊高效、低功耗地集成在一起,并保證其協(xié)同工作,還要實(shí)現(xiàn)差異化優(yōu)勢(shì),這是真正的難點(diǎn)所在。
一位芯片行業(yè)人士告訴智東西,最難的不是“自研”,而是真正把芯片設(shè)計(jì)的每一個(gè)細(xì)節(jié)吃透,做出一個(gè)成熟好用、性能功耗平衡優(yōu)秀的芯片,實(shí)際上,實(shí)現(xiàn)這件事的過程,就是在自研芯片。
可以看到,一方面,自研芯片核心技術(shù)可以直觀地給產(chǎn)品帶來性能或體驗(yàn)的優(yōu)勢(shì),另一方面,芯片自研帶來的不僅是芯片產(chǎn)品本身,更是對(duì)一家廠商整個(gè)技術(shù)版圖的重要補(bǔ)全,對(duì)廠商優(yōu)化芯片與操作系統(tǒng)、大模型、應(yīng)用的協(xié)同都會(huì)有幫助。
不做深度自研,很難像蘋果一樣實(shí)現(xiàn)人無我有的優(yōu)勢(shì),強(qiáng)化手機(jī)AI芯片自研技術(shù),已經(jīng)成為行業(yè)的必然方向。
三、都說蘋果AI掉隊(duì)了,怎么突然被蘋果“反將一手”?
正如前文所說,如今早已不是“唯TOPS論”的時(shí)代,隨著端側(cè)AI快速發(fā)展,AI應(yīng)用真正落地的能效表現(xiàn)成為行業(yè)關(guān)注焦點(diǎn)。
優(yōu)秀模型一個(gè)接一個(gè),但AI手機(jī)上的AI應(yīng)用能否高效利用端側(cè)AI大模型能力,如何在有限的能效內(nèi)更高效地運(yùn)行AI,最終實(shí)現(xiàn)好的AI體驗(yàn),仍然存在很大優(yōu)化空間。
在芯片本身過硬的基礎(chǔ)上,手機(jī)AI芯片的相關(guān)開發(fā)加速工具支持完善程度也十分關(guān)鍵。
在這方面,蘋果在今年WWDC上,邁出了非常關(guān)鍵的一步——向所有App開放權(quán)限,允許App直接訪問蘋果智能核心的設(shè)備端大語言模型。
如何訪問?蘋果發(fā)布了基礎(chǔ)模型框架,也就是如今業(yè)內(nèi)常常被討論的蘋果開源機(jī)器學(xué)習(xí)框架(MLX),讓開發(fā)者可以使用蘋果的模型,開發(fā)工具層面的App Intents則讓開發(fā)者能在整個(gè)系統(tǒng)中關(guān)聯(lián)自己App的內(nèi)容和功能。
具體來看,蘋果MLX支持Python、C++、C和Swift等多種主流編程語言,根據(jù)GitHub信息,其API對(duì)于開發(fā)者來說熟悉易用,同時(shí)支持函數(shù)變換的組合性、延遲計(jì)算模式、動(dòng)態(tài)圖構(gòu)建、跨設(shè)備運(yùn)行能力以及統(tǒng)一內(nèi)存模型。
在性能方面,跟傳統(tǒng)的機(jī)器學(xué)習(xí)框架相比,蘋果MLX內(nèi)存?zhèn)鬏旈_銷為零拷貝,同時(shí)對(duì)蘋果芯片GPU計(jì)算能力進(jìn)行了優(yōu)化,未來MLX可以直接調(diào)用ANE專用指令集,而其他框架大多是間接支持或有限支持;動(dòng)態(tài)圖響應(yīng)速度方面,MLX能達(dá)到毫秒級(jí),PyTorch為秒級(jí),TensorFlow則需分鐘級(jí)。
對(duì)于開發(fā)者們來說,MLX的實(shí)時(shí)錯(cuò)誤追蹤比傳統(tǒng)靜態(tài)圖框架快3-5倍,85%的NumPy/PyTorch代碼可直接遷移,并且還可以利用蘋果芯片統(tǒng)一架構(gòu)減少跨平臺(tái)適配工作。
可以說,蘋果MLX是全流程的開源框架,從模型訓(xùn)練到推理的端側(cè)優(yōu)化,并且深度整合了自家的硬件。
安卓陣營(yíng)中雖然沒有能完全對(duì)標(biāo)蘋果MLX的開源機(jī)器學(xué)習(xí)框架,但在開發(fā)者提效降本方面也都發(fā)布了各自的軟件平臺(tái)或開發(fā)工具。安卓陣營(yíng)的芯片廠商更多通過閉源SDK或開源協(xié)作的方式支持AI開發(fā)。
比如高通的AI軟件棧,可以讓開發(fā)者在手機(jī)上市幾個(gè)月前,通過高通Device Cloud,基于驍龍8 Elite開發(fā)AI應(yīng)用服務(wù),進(jìn)行調(diào)試、優(yōu)化。AI應(yīng)用可以通過ONNX、DirectML等框架和高通AI軟件棧,實(shí)現(xiàn)NPU的加速。
▲高通AI軟件棧
聯(lián)發(fā)科這邊則有天璣開發(fā)工具集(Dimensity Development Studio),比如其中的Neuron Studio能基于神經(jīng)網(wǎng)絡(luò)進(jìn)行自動(dòng)化調(diào)優(yōu),幫開發(fā)者進(jìn)行跨模型的全鏈路分析,節(jié)省調(diào)優(yōu)時(shí)間。
此外,聯(lián)發(fā)科的天璣AI開發(fā)套件2.0,通過開源彈性架構(gòu)提升開放度,模型庫適配的模型數(shù)量提升了3.3倍,對(duì)DeepSeek這樣的熱門模型的關(guān)鍵技術(shù)實(shí)現(xiàn)端側(cè)支持,提升tokens的生產(chǎn)速度。
總體來看,讓AI芯片的能力可以被開發(fā)者高效地用到AI應(yīng)用中,實(shí)現(xiàn)更好的端側(cè)AI體驗(yàn),這事目前仍然只有蘋果做的是最完善的,安卓陣營(yíng)并非不做,但生態(tài)層面的不統(tǒng)一、各自為戰(zhàn)仍然會(huì)帶來很大挑戰(zhàn)。
結(jié)語:手機(jī)AI芯片之戰(zhàn),不能輸?shù)挠舱?/p>
在AI手機(jī)高歌猛進(jìn)之下,手機(jī)AI芯片走到了舞臺(tái)C位,成為巨頭兵家必爭(zhēng)之地。
雖然蘋果看似在AI功能落地的“豐富度”上少了些驚艷感,但仔細(xì)梳理卻能看到其AI功能端側(cè)實(shí)現(xiàn)占比極高,其從底層芯片、操作系統(tǒng)到大模型、應(yīng)用的打通,是安卓陣營(yíng)極難段時(shí)間追趕的。
蘋果AI誠(chéng)然有其內(nèi)部深層次問題,從團(tuán)隊(duì)到技術(shù),但歸根結(jié)底,蘋果依然按照他最擅長(zhǎng)的做法——小步快跑,來做AI,蘋果確實(shí)在“架橋鋪路”上花費(fèi)了更多時(shí)間,但一旦打好地基,AI大廈的上限將充滿巨大想象空間。
這也是安卓陣營(yíng)從終端廠商到芯片廠商都不斷加碼芯片自研技術(shù)布局的重要性所在。真正好的端側(cè)AI體驗(yàn),離不開這些底層技術(shù)的支撐。
毫無疑問,AI的到來給手機(jī)芯片市場(chǎng)注入了新的活力,帶來了新的變量,能否做出好的手機(jī)AI芯片將成為決勝AI手機(jī)之戰(zhàn)的關(guān)鍵。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.