網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

蘋(píng)果開(kāi)放端側(cè)模型，相信AI體驗(yàn)的好戲還在后頭

2025-06-10 22:19:10　來(lái)源: 未盡研究

上海舉報(bào)

分享至

蘋(píng)果只有在端側(cè)設(shè)備做出真正的個(gè)人AI體驗(yàn)，才能讓下一個(gè)iPhone時(shí)刻真正仍然屬于自己。

而蘋(píng)果的一貫做法，是要把決定用戶體驗(yàn)的技術(shù)牢牢掌控在自己手心。為了在AI時(shí)代繼續(xù)引領(lǐng)和定義用戶體驗(yàn)，蘋(píng)果必須擁有自主的模型能力。

蘋(píng)果承認(rèn)自己還沒(méi)做好，“大招”留到了明年宣布。為了保住明年還在場(chǎng)上的機(jī)會(huì)，它決定向開(kāi)發(fā)者開(kāi)放自己的30億參數(shù)規(guī)模的端側(cè)模型。蘋(píng)果自認(rèn)為它很不錯(cuò)，和相近尺寸的開(kāi)源模型Qwen-3與Gemma-3打得有來(lái)有回。

在本屆開(kāi)發(fā)者大會(huì)（WWDC）上，蘋(píng)果非常“務(wù)實(shí)”。蘋(píng)果軟件總管Craig承認(rèn)Siri延期，“需要更多時(shí)間來(lái)達(dá)到高質(zhì)量標(biāo)準(zhǔn)”，并且約定來(lái)年再“分享更多信息”。言下之意，離用戶正式到手體驗(yàn)，還要更遠(yuǎn)。到時(shí)候，“滿血版”Siri大戰(zhàn)“注水版”AGI，令人期待。

在這之前，蘋(píng)果要保住自己的3萬(wàn)億美元市值，一方面向用戶釋放了部分準(zhǔn)備就緒的AI功能，一方面允許開(kāi)發(fā)者調(diào)用自己的端側(cè)大模型。前者事實(shí)上是后者的“樣板”，蘋(píng)果很多第一方應(yīng)用，最終會(huì)被用戶換成更強(qiáng)大的第三方應(yīng)用。

在WWDC上，蘋(píng)果給用戶，也給開(kāi)發(fā)者展示了端側(cè)模型可以怎么用，包括更加智能的來(lái)電篩選與垃圾信息過(guò)濾，新的語(yǔ)音信箱摘要等等，還包括通話語(yǔ)音實(shí)時(shí)翻譯。這些都是基于蘋(píng)果本地 “強(qiáng)大、快速、注重隱私”的端側(cè)模型，開(kāi)發(fā)者可以通過(guò)基礎(chǔ)模型框架（FMF）直接訪問(wèn)，不需要額外token支出。

盡管外界開(kāi)始質(zhì)疑蘋(píng)果被“隱私”的包袱拖累了，但在模型官方文檔上，蘋(píng)果始終強(qiáng)調(diào)著“隱私”，包括端側(cè)模型與云端模型的推理。蘋(píng)果重申，在訓(xùn)練基礎(chǔ)模型時(shí)，也沒(méi)有用到用戶的個(gè)人數(shù)據(jù)或交互數(shù)據(jù)。

蘋(píng)果已經(jīng)確認(rèn)開(kāi)發(fā)者可以調(diào)用的端側(cè)模型，為30億參數(shù)的緊湊型（compact）模型，能在蘋(píng)果的自研芯片上運(yùn)行。事實(shí)上，蘋(píng)果此前已經(jīng)多次透露過(guò)這款模型的存在。蘋(píng)果還介紹了一款更大參數(shù)規(guī)模的混合專家模型（MOE），只能運(yùn)行在專門(mén)定制的“新穎架構(gòu)”的私有云上，以確保隱私。等它足夠好了，蘋(píng)果會(huì)出售云端模型的API服務(wù)嗎？

蘋(píng)果自勉道，這一年來(lái)，自己努力改進(jìn)了它們的性能，還降低了它們的功耗。基于蘋(píng)果提供的測(cè)試結(jié)果，它的端側(cè)模型在所有語(yǔ)種中的表現(xiàn)，都要稍優(yōu)于上一代的Qwen-2.5-3B，在英語(yǔ)環(huán)境中的表現(xiàn)，則與略大于它的Qwen-3-4B與Gemma-3-4B不相上下。它的云端模型優(yōu)于Llama-4-Scout，但仍然落后于Qwen-3-235B與GPT-4o。

這兩個(gè)大型語(yǔ)言模型只是蘋(píng)果基礎(chǔ)模型家族的一部分。媒體曾在WWDC前披露蘋(píng)果還在訓(xùn)練70億與330億參數(shù)的模型。也許，它們會(huì)用在蘋(píng)果其他本地算力更充裕的終端設(shè)備上，并在時(shí)機(jī)合適時(shí)向開(kāi)發(fā)者開(kāi)放。

蘋(píng)果還介紹了自己的視覺(jué)模型，同樣分為端側(cè)與云端。前者約3億參數(shù)，后者約10億參數(shù)。在蘋(píng)果內(nèi)部的基準(zhǔn)測(cè)試中，它們表現(xiàn)均超過(guò)了Qwen-2.5-VL-32B；端側(cè)模型與Gemma-3-4B相當(dāng)，但是云端模型要遜于Llama-4-Scout，更別提原生圖片火爆到可以“熔化GPU”的GPT-4o了。如果蘋(píng)果AI戰(zhàn)略步調(diào)一致，端側(cè)視覺(jué)模型也將向開(kāi)發(fā)者開(kāi)放。

開(kāi)放端側(cè)模型，有利于挽回一批中小型開(kāi)發(fā)者。現(xiàn)在，他們的關(guān)系因?yàn)椤疤O(píng)果稅”有點(diǎn)緊張。這些開(kāi)發(fā)者也需要AI，否則它們的應(yīng)用將失去競(jìng)爭(zhēng)力，至少在營(yíng)銷上缺乏亮點(diǎn)。它們將被其他大模型提供商或開(kāi)源模型生態(tài)吸引走。

云端算力服務(wù)還是太貴了。軟件長(zhǎng)期毛利率正在結(jié)構(gòu)性地降低。最近一個(gè)季度，Duolingo的營(yíng)收大幅增長(zhǎng)了38個(gè)百分點(diǎn)，但是毛利率降低了超過(guò)1個(gè)百分點(diǎn)；該公司去年還裁撤了10%的內(nèi)容供應(yīng)商。

開(kāi)源模型的二次開(kāi)發(fā)也并不容易。谷歌、小米等智能終端競(jìng)爭(zhēng)對(duì)手，都開(kāi)源了自己的端側(cè)大模型，谷歌還提供專門(mén)的開(kāi)發(fā)工具。但對(duì)于中小開(kāi)發(fā)者而言，直接接入端側(cè)模型的API的門(mén)檻更低。

蘋(píng)果的開(kāi)放策略，簡(jiǎn)單粗暴。它就是抓住那批需要在自己應(yīng)用里添加免費(fèi)、好用的“摘要、實(shí)體提取、文本理解、潤(rùn)色、短對(duì)話”等功能的開(kāi)發(fā)者。在30億規(guī)模參數(shù)上，如果比Gemma和Qwen系列要好用，蘋(píng)果仍然具備一定的競(jìng)爭(zhēng)力。中小開(kāi)發(fā)者原本也就沒(méi)指望在自己的應(yīng)用里塞進(jìn)一個(gè)免費(fèi)的堪比超人的通用智能體。在社交媒體X上，一些開(kāi)發(fā)者已經(jīng)躍躍欲試，將蘋(píng)果FMF的推出，類比為2008年App Store的上線。

也許，未來(lái)隨著大模型訓(xùn)練、蒸餾與優(yōu)化等技術(shù)的提升，蘋(píng)果能用同等參數(shù)規(guī)模的模型向開(kāi)發(fā)者提供更豐富的AI功能；硬件性能也還在提升。蘋(píng)果需要的就是時(shí)間。

毫無(wú)疑問(wèn)，蘋(píng)果在AI上落后了，而且是美股七巨頭中“遙遙落后”的那家。這兩年，它的技術(shù)與商業(yè)節(jié)奏，就是盡可能地撬動(dòng)平臺(tái)的杠桿，去彌補(bǔ)自身AI技術(shù)遲緩的缺口。去年，向OpenAI等外部大模型“求助”；今年，向開(kāi)發(fā)者等外部應(yīng)用“示好”。

最終，蘋(píng)果會(huì)自己?jiǎn)胃蓡幔恳苍S，在沒(méi)有地緣因素限制下，如果它有能力，它會(huì)。在今天的WWDC上，蘋(píng)果宣布從macOS 27起將不再兼容任何Intel Macs；蘋(píng)果自研的首款5G基帶也在今年正式登場(chǎng)。如果大模型與智能體關(guān)系到蘋(píng)果的“隱私”、“安全”與“用戶體驗(yàn)”，以及源源不斷的“現(xiàn)金流”，還是統(tǒng)統(tǒng)握在自己手里更放心。也許，“流體玻璃”的UI設(shè)計(jì)，就是為Apple Intelligence的AI體驗(yàn)提前準(zhǔn)備的。

可能蘋(píng)果覺(jué)得，盡管在前沿大模型的探索方面自己沒(méi)有（必要）領(lǐng)先，在蘋(píng)果設(shè)備上做出真正的AI體驗(yàn)，時(shí)間還來(lái)得及。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.