99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

蘋果發布2025基礎模型報告,揭開Apple Intelligence技術全貌

0
分享至

蘋果公司近日正式發布了《Apple Intelligence Foundation Language Models Tech Report 2025》技術報告,這是繼去年首次公開其 AI 基礎模型技術細節后的重要更新。而且,就在不久前 Meta 剛剛以數千萬美元薪酬挖走了蘋果基礎模型團隊負責人龐若鳴(Ruoming Pang),這份技術報告很可能是龐若鳴在蘋果生涯的最后一份重要成果。

龐若鳴本人也在社交媒體上對這份報告進行了介紹,并正式將團隊的重任交接給了 Zhifeng Chen。


圖丨相關推文(來源:X)

報告詳細介紹了一套雙軌并行的模型策略。第一款是一個約 30 億參數的端上模型,專為在 iPhone、iPad 和 Mac 等蘋果設備上高效運行而設計。該模型經過深度優化,以充分利用蘋果自研芯片的性能。另一款則是在蘋果私有云計算上運行的可擴展服務器模型,用于處理更復雜的用戶請求。這種“端云協同”的架構旨在平衡性能、效率和隱私,簡單的任務在本地設備上完成,復雜任務則交由具備同等級別隱私保護的云端服務器處理。


圖丨蘋果基礎模型的框架概覽(來源:Apple)

為了提升端上模型的運行效率,蘋果的工程師們引入了一項名為“鍵值緩存共享”(KV Cache Sharing)的創新架構。具體而言,他們將模型劃分為兩個區塊,其中一個區塊(占模型層數的 37.5%)直接共享另一區塊(占 62.5%)生成的鍵值緩存,從而將緩存所需的內存減少了 37.5%,并顯著縮短了生成第一個詞元 token 的響應時間。

對于服務器端模型,蘋果則開發了一種名為“并行軌道混合專家”(Parallel-Track Mixture-of-Experts, PT-MoE)的全新 Transformer 架構。該架構將一個大型模型分解為多個更小的、被稱為“軌道”(Track)的并行處理單元。每個軌道獨立處理信息,僅在特定節點進行同步,從而大幅減少了傳統大型模型中常見的通信瓶頸,提高了訓練和推理的效率。此外,通過在每個軌道內部署混合專家(MoE)層,該模型能夠更高效地擴展,以低延遲處理復雜任務,同時不犧牲模型質量。


圖丨PT-MoE 架構示意圖(來源:Apple)

在賦予模型理解圖像的多模態能力方面,報告也披露了其視覺編碼器的技術細節。服務器和端上模型分別采用了 ViT-g 和更高效的 ViTDet-L 作為視覺主干網絡。值得一提的是,端上模型還采用了一種新穎的“寄存器-窗口”(Register-Window)機制,使其能夠同時有效捕捉圖像的全局上下文信息和局部精細細節。

在訓練數據方面,蘋果保持了其一貫強調隱私保護的風格,在報告中明確了其數據來源和隱私原則。訓練數據主要來自三方面:從出版商處授權的數據、由蘋果網頁爬蟲 Applebot 抓取的公開網絡信息,以及高質量的合成數據。蘋果特別強調,在訓練過程中絕不使用用戶的私人個人數據或用戶交互信息。

同時,公司遵循 robots.txt 協議,允許網站發布者選擇不讓其內容被用于模型訓練,從源頭上保障了內容所有者的權利和用戶隱私。報告顯示,蘋果處理了超過 100 億對高質量的圖文對和 50 億對合成圖像標題數據,并通過先進的流水線進行過濾和提純,以確保訓練數據的質量。


圖丨蘋果的分布式異步強化學習基礎設施(來源:Apple)

為了讓這些模型能在實際設備上高效運行,蘋果采用了積極的優化策略。端上模型通過“量化感知訓練”(Quantization-Aware Training, QAT)技術,將模型權重壓縮至每權重 2 比特。服務器模型則利用了一種名為“自適應可擴展紋理壓縮”(Adaptive Scalable Texture Compression, ASTC)的技術,該技術利用了蘋果 GPU 中已有的硬件解壓模塊,能夠以幾乎零計算成本的方式對模型權重進行解壓,最終將模型壓縮至每權重約 3.56 比特。對于壓縮過程中可能出現的性能損失,蘋果則通過訓練低秩適配器(Low-Rank Adaptation, LoRA)來進行補償和恢復。

性能評估的結果顯示,在 MMLU 等標準測試中,蘋果的端上模型表現優于或持平于 Qwen-2.5-3B、Gemma-3-4B 等同規模的開源模型。


(來源:Apple)

服務器模型則在與 LLaMA 4 Scout 的對比中表現出色,但與 Qwen-3-235B 和 GPT-4o 等更大規模的模型相比仍有差距。在與人類評分員進行的并排比較中,蘋果的模型在多個語言區域和任務中的表現都較為突出。


圖丨蘋果基礎模型在文本上的人類評估(來源:Apple)

最后,蘋果還為開發者推出了全新的“基礎模型框架”(Foundation Models framework),允許開發者直接調用設備上的 30 億參數模型。該框架與 Swift 語言深度集成,通過名為“引導式生成”的功能,開發者可以僅用幾行代碼就讓模型直接生成結構化的 Swift 數據類型,極大地簡化了在應用中集成 AI 功能的過程。蘋果強調,整個框架的設計都貫徹了其負責任 AI 的原則,內置了多重安全護欄,旨在幫助開發者構建既智能又注重隱私保護的下一代應用。

參考資料:

1. https://machinelearning.apple.com/research/apple-foundation-models-tech-report-2025

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結果曝光

我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結果曝光

鋭娛之樂
2025-07-19 01:55:03
美國解禁H20芯片AB面,黃仁勛一年三次來華的“芯”事

美國解禁H20芯片AB面,黃仁勛一年三次來華的“芯”事

新京報
2025-07-19 15:56:50
福建福耀科技大學最低投檔線公布,超過多所雙一流名校!曹德旺:首年8億元預算招50個學生,對標斯坦福

福建福耀科技大學最低投檔線公布,超過多所雙一流名校!曹德旺:首年8億元預算招50個學生,對標斯坦福

每日經濟新聞
2025-07-19 17:50:10
iPhone可能得漲價,因為京東方在正面硬剛三星。。。

iPhone可能得漲價,因為京東方在正面硬剛三星。。。

差評XPIN
2025-07-19 00:10:12
19歲高考生講述被騙緬甸經歷:通過招聘軟件求職,有人稱當主播掙大錢

19歲高考生講述被騙緬甸經歷:通過招聘軟件求職,有人稱當主播掙大錢

極目新聞
2025-07-19 14:20:09
娃哈哈發家黑歷史:激素營養液坑娃,國資攤派強賣,第一桶金帶血

娃哈哈發家黑歷史:激素營養液坑娃,國資攤派強賣,第一桶金帶血

爆角追蹤
2025-07-19 23:29:04
向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

李砍柴
2025-07-18 23:42:24
司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

古希臘掌管松餅的神
2025-07-19 08:57:51
“我本來能上985的”,女生報考福耀科技大后悔,反被招生辦打臉

“我本來能上985的”,女生報考福耀科技大后悔,反被招生辦打臉

妍妍教育日記
2025-07-19 10:16:22
土耳其戰以色列,中東新局勢洗牌

土耳其戰以色列,中東新局勢洗牌

楊風
2025-07-18 23:24:30
放棄了太多!拉什福德為去巴薩曾狂加練+愿大幅降薪 現成功租借

放棄了太多!拉什福德為去巴薩曾狂加練+愿大幅降薪 現成功租借

直播吧
2025-07-19 23:08:18
鄭欽文完成右肘手術

鄭欽文完成右肘手術

界面新聞
2025-07-19 17:50:27
俄烏紅軍村生死對決,F16再次擊落蘇35

俄烏紅軍村生死對決,F16再次擊落蘇35

史政先鋒
2025-07-19 20:32:44
六連勝5分領跑!南通2-1鹽城 程鑫精彩抽射破門鹽城首敗仍居第2

六連勝5分領跑!南通2-1鹽城 程鑫精彩抽射破門鹽城首敗仍居第2

直播吧
2025-07-19 21:43:15
炸裂!杜建英被曝腳踩兩條船,舊照曝光,與原配從未離婚育有一子

炸裂!杜建英被曝腳踩兩條船,舊照曝光,與原配從未離婚育有一子

吭哧有力
2025-07-19 16:23:44
柜姐群毆顧客后續!女兒崩潰哭泣,路人曝實情,店鋪存在多次差評

柜姐群毆顧客后續!女兒崩潰哭泣,路人曝實情,店鋪存在多次差評

鋭娛之樂
2025-07-19 19:11:06
女籃負于日本無緣決賽,張子宇被日本16記三分球瘋狂點名

女籃負于日本無緣決賽,張子宇被日本16記三分球瘋狂點名

李廣專業體育評論
2025-07-19 21:19:07
后續!暴走團領隊囂張回應,央媒發文嚴厲批評,這下警方尷尬了!

后續!暴走團領隊囂張回應,央媒發文嚴厲批評,這下警方尷尬了!

譚談社會
2025-07-19 16:09:27
娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

老爵爺沉思錄
2025-07-18 22:25:04
吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕就上演!

吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕就上演!

春秋論娛
2025-07-17 19:46:54
2025-07-20 00:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15427文章數 513915關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

體育要聞

女籃無緣亞洲杯決賽 韓旭淚灑發布會

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

教育
時尚
房產
游戲
親子

教育要聞

查錄取結果!華師2025年投檔分數線定了!

隨手拍也能美上熱搜,這個穿搭真的自帶美女氛圍

房產要聞

漏水、開裂…為阻止降價,??谶@個盤業主集體爆黑料,還講鬼故事!

LPL第三階段:宇智波柴,摧毀極影村!TES三局擊潰IG!

親子要聞

孩子突然不愿意上學?4個深層原因+4步拯救法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 新乡县| 红河县| 重庆市| 舞钢市| 横山县| 宁武县| 威信县| 秀山| 安顺市| 吐鲁番市| 旌德县| 涪陵区| 额尔古纳市| 绩溪县| 三明市| 丰原市| 巴楚县| 贺兰县| 额尔古纳市| 遂溪县| 同江市| 资溪县| 蓬溪县| 晋城| 虞城县| 蒲城县| 确山县| 河源市| 嘉义县| 广丰县| 手机| 武宣县| 克东县| 黄龙县| 河曲县| 林甸县| 玉溪市| 鸡西市| 文水县| 崇仁县| 白山市|