蘋(píng)果只有在端側(cè)設(shè)備做出真正的個(gè)人AI體驗(yàn),才能讓下一個(gè)iPhone時(shí)刻真正仍然屬于自己。
而蘋(píng)果的一貫做法,是要把決定用戶體驗(yàn)的技術(shù)牢牢掌控在自己手心。為了在AI時(shí)代繼續(xù)引領(lǐng)和定義用戶體驗(yàn),蘋(píng)果必須擁有自主的模型能力。
蘋(píng)果承認(rèn)自己還沒(méi)做好,“大招”留到了明年宣布。為了保住明年還在場(chǎng)上的機(jī)會(huì),它決定向開(kāi)發(fā)者開(kāi)放自己的30億參數(shù)規(guī)模的端側(cè)模型。蘋(píng)果自認(rèn)為它很不錯(cuò),和相近尺寸的開(kāi)源模型Qwen-3與Gemma-3打得有來(lái)有回。
在本屆開(kāi)發(fā)者大會(huì)(WWDC)上,蘋(píng)果非常“務(wù)實(shí)”。蘋(píng)果軟件總管Craig承認(rèn)Siri延期,“需要更多時(shí)間來(lái)達(dá)到高質(zhì)量標(biāo)準(zhǔn)”,并且約定來(lái)年再“分享更多信息”。言下之意,離用戶正式到手體驗(yàn),還要更遠(yuǎn)。到時(shí)候,“滿血版”Siri大戰(zhàn)“注水版”AGI,令人期待。
在這之前,蘋(píng)果要保住自己的3萬(wàn)億美元市值,一方面向用戶釋放了部分準(zhǔn)備就緒的AI功能,一方面允許開(kāi)發(fā)者調(diào)用自己的端側(cè)大模型。前者事實(shí)上是后者的“樣板”,蘋(píng)果很多第一方應(yīng)用,最終會(huì)被用戶換成更強(qiáng)大的第三方應(yīng)用。
在WWDC上,蘋(píng)果給用戶,也給開(kāi)發(fā)者展示了端側(cè)模型可以怎么用,包括更加智能的來(lái)電篩選與垃圾信息過(guò)濾,新的語(yǔ)音信箱摘要等等,還包括通話語(yǔ)音實(shí)時(shí)翻譯。這些都是基于蘋(píng)果本地 “強(qiáng)大、快速、注重隱私”的端側(cè)模型,開(kāi)發(fā)者可以通過(guò)基礎(chǔ)模型框架(FMF)直接訪問(wèn),不需要額外token支出。
盡管外界開(kāi)始質(zhì)疑蘋(píng)果被“隱私”的包袱拖累了,但在模型官方文檔上,蘋(píng)果始終強(qiáng)調(diào)著“隱私”,包括端側(cè)模型與云端模型的推理。蘋(píng)果重申,在訓(xùn)練基礎(chǔ)模型時(shí),也沒(méi)有用到用戶的個(gè)人數(shù)據(jù)或交互數(shù)據(jù)。
蘋(píng)果已經(jīng)確認(rèn)開(kāi)發(fā)者可以調(diào)用的端側(cè)模型,為30億參數(shù)的緊湊型(compact)模型,能在蘋(píng)果的自研芯片上運(yùn)行。事實(shí)上,蘋(píng)果此前已經(jīng)多次透露過(guò)這款模型的存在。蘋(píng)果還介紹了一款更大參數(shù)規(guī)模的混合專家模型(MOE),只能運(yùn)行在專門(mén)定制的“新穎架構(gòu)”的私有云上,以確保隱私。等它足夠好了,蘋(píng)果會(huì)出售云端模型的API服務(wù)嗎?
蘋(píng)果自勉道,這一年來(lái),自己努力改進(jìn)了它們的性能,還降低了它們的功耗。基于蘋(píng)果提供的測(cè)試結(jié)果,它的端側(cè)模型在所有語(yǔ)種中的表現(xiàn),都要稍優(yōu)于上一代的Qwen-2.5-3B,在英語(yǔ)環(huán)境中的表現(xiàn),則與略大于它的Qwen-3-4B與Gemma-3-4B不相上下。它的云端模型優(yōu)于Llama-4-Scout,但仍然落后于Qwen-3-235B與GPT-4o。
這兩個(gè)大型語(yǔ)言模型只是蘋(píng)果基礎(chǔ)模型家族的一部分。媒體曾在WWDC前披露蘋(píng)果還在訓(xùn)練70億與330億參數(shù)的模型。也許,它們會(huì)用在蘋(píng)果其他本地算力更充裕的終端設(shè)備上,并在時(shí)機(jī)合適時(shí)向開(kāi)發(fā)者開(kāi)放。
蘋(píng)果還介紹了自己的視覺(jué)模型,同樣分為端側(cè)與云端。前者約3億參數(shù),后者約10億參數(shù)。在蘋(píng)果內(nèi)部的基準(zhǔn)測(cè)試中,它們表現(xiàn)均超過(guò)了Qwen-2.5-VL-32B;端側(cè)模型與Gemma-3-4B相當(dāng),但是云端模型要遜于Llama-4-Scout,更別提原生圖片火爆到可以“熔化GPU”的GPT-4o了。如果蘋(píng)果AI戰(zhàn)略步調(diào)一致,端側(cè)視覺(jué)模型也將向開(kāi)發(fā)者開(kāi)放。
開(kāi)放端側(cè)模型,有利于挽回一批中小型開(kāi)發(fā)者。現(xiàn)在,他們的關(guān)系因?yàn)椤疤O(píng)果稅”有點(diǎn)緊張。這些開(kāi)發(fā)者也需要AI,否則它們的應(yīng)用將失去競(jìng)爭(zhēng)力,至少在營(yíng)銷上缺乏亮點(diǎn)。它們將被其他大模型提供商或開(kāi)源模型生態(tài)吸引走。
云端算力服務(wù)還是太貴了。軟件長(zhǎng)期毛利率正在結(jié)構(gòu)性地降低。最近一個(gè)季度,Duolingo的營(yíng)收大幅增長(zhǎng)了38個(gè)百分點(diǎn),但是毛利率降低了超過(guò)1個(gè)百分點(diǎn);該公司去年還裁撤了10%的內(nèi)容供應(yīng)商。
開(kāi)源模型的二次開(kāi)發(fā)也并不容易。谷歌、小米等智能終端競(jìng)爭(zhēng)對(duì)手,都開(kāi)源了自己的端側(cè)大模型,谷歌還提供專門(mén)的開(kāi)發(fā)工具。但對(duì)于中小開(kāi)發(fā)者而言,直接接入端側(cè)模型的API的門(mén)檻更低。
蘋(píng)果的開(kāi)放策略,簡(jiǎn)單粗暴。它就是抓住那批需要在自己應(yīng)用里添加免費(fèi)、好用的“摘要、實(shí)體提取、文本理解、潤(rùn)色、短對(duì)話”等功能的開(kāi)發(fā)者。在30億規(guī)模參數(shù)上,如果比Gemma和Qwen系列要好用,蘋(píng)果仍然具備一定的競(jìng)爭(zhēng)力。中小開(kāi)發(fā)者原本也就沒(méi)指望在自己的應(yīng)用里塞進(jìn)一個(gè)免費(fèi)的堪比超人的通用智能體。在社交媒體X上,一些開(kāi)發(fā)者已經(jīng)躍躍欲試,將蘋(píng)果FMF的推出,類比為2008年App Store的上線。
也許,未來(lái)隨著大模型訓(xùn)練、蒸餾與優(yōu)化等技術(shù)的提升,蘋(píng)果能用同等參數(shù)規(guī)模的模型向開(kāi)發(fā)者提供更豐富的AI功能;硬件性能也還在提升。蘋(píng)果需要的就是時(shí)間。
毫無(wú)疑問(wèn),蘋(píng)果在AI上落后了,而且是美股七巨頭中“遙遙落后”的那家。這兩年,它的技術(shù)與商業(yè)節(jié)奏,就是盡可能地撬動(dòng)平臺(tái)的杠桿,去彌補(bǔ)自身AI技術(shù)遲緩的缺口。去年,向OpenAI等外部大模型“求助”;今年,向開(kāi)發(fā)者等外部應(yīng)用“示好”。
最終,蘋(píng)果會(huì)自己?jiǎn)胃蓡幔恳苍S,在沒(méi)有地緣因素限制下,如果它有能力,它會(huì)。在今天的WWDC上,蘋(píng)果宣布從macOS 27起將不再兼容任何Intel Macs;蘋(píng)果自研的首款5G基帶也在今年正式登場(chǎng)。如果大模型與智能體關(guān)系到蘋(píng)果的“隱私”、“安全”與“用戶體驗(yàn)”,以及源源不斷的“現(xiàn)金流”,還是統(tǒng)統(tǒng)握在自己手里更放心。也許,“流體玻璃”的UI設(shè)計(jì),就是為Apple Intelligence的AI體驗(yàn)提前準(zhǔn)備的。
可能蘋(píng)果覺(jué)得,盡管在前沿大模型的探索方面自己沒(méi)有(必要)領(lǐng)先,在蘋(píng)果設(shè)備上做出真正的AI體驗(yàn),時(shí)間還來(lái)得及。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.