99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

龐若鳴交班陳智峰,蘋果發布2025基礎模型技術報告

0
分享至




機器之心報道

編輯:澤南

Apple Intelligence 進入新的一章。

近日,蘋果發布了 2025 年 Apple Intelligence 基礎語言模型技術報告。

剛剛加入 Meta 的前蘋果 AI 負責人龐若鳴(Ruoming Pang)發出多條推文進行了介紹。



在報告中,蘋果詳細介紹了訓練新一代模型所用的數據、模型架構、訓練方案、優化推理技術手段,以及與同類模型對比的評估結果。文中重點展示了蘋果如何在提升用戶價值的同時實現功能擴展與質量優化,并大幅提高設備端和私有云計算的運行效率。



報告鏈接:https://machinelearning.apple.com/research/apple-foundation-models-tech-report-2025

這次蘋果介紹了兩種多語言、多模態基礎語言模型,可為蘋果設備和服務中的 Apple Intelligence 功能提供支持。其中包括:

1)通過 KV 緩存共享和 2 位量化感知訓練等架構創新,針對蘋果自有芯片進行了優化的 3B 參數設備模型;2)一種可擴展的云端模型,它結合了新型并行軌道混合專家 (PT-MoE) Transformer 和交錯的全局 - 局部注意力,以便在蘋果的私有云計算平臺上進行有效推理。

這兩款模型均通過負責任的網絡爬取、授權語料庫和高質量合成數據集進行大規模多語言、多模態訓練,并在新的異步平臺上通過監督微調和強化學習進一步優化。最終模型不僅支持多種新增語言,還能理解圖像并執行工具調用。



PT-MoE 架構示意圖。每個軌跡 track 由多個軌跡塊組成,每個軌跡塊包含固定數量的 Transformer/MoE 層。假設總層數為 L 層且軌跡塊深度為 D,則同步開銷可從 2L(張量并行)降低至 L/D(軌跡并行)。例如當 D = 4 時,PT 架構可將同步開銷減少 87.5%。

PT Transformer是蘋果研究人員提出的一種新型架構。與僅包含單一順序層堆棧的標準解碼器式 Transformer 不同,該架構將模型劃分為多個小型 Transformer 模塊,稱為軌道。每個軌道由多個堆疊的軌道塊組成,每個軌道塊本身都是一個 Transformer 層堆棧。這些軌道塊獨立處理標記數據,僅在軌道塊的輸入輸出邊界進行跨軌道同步。這種隔離設計不僅實現了軌道間的直接并行執行,還有效降低了傳統 Transformer 解碼器(如采用張量并行技術的模型)中常見的同步開銷。這種方法被稱為軌跡并行,改進了訓練和推理的延遲,而不會影響模型的質量。

為實現服務器端模型的進一步擴展,蘋果在每個軌道塊內部引入了專家混合層(MoE),從而構建出 PT-MoE 架構。由于各 MoE 層中的專家模塊僅在對應軌道內運行,通信開銷可與計算過程有效重疊,從而提升訓練效率。結合軌道并行性帶來的軌道級獨立性優勢,這種設計使模型在保持低延遲的同時實現高效擴展 —— 得益于稀疏度的提升,模型運行更加輕量化。

另外為了實現現視覺理解能力,蘋果引入了一個可以從輸入圖像中提取視覺特征的視覺編碼器,在大量圖像數據上進行了預訓練,以提高其性能。視覺編碼器包含兩個關鍵組件:一個視覺主干,用于從輸入圖像中提取豐富的視覺表征;以及一個視覺語言適應模塊,用于壓縮視覺表征并將這些視覺特征與模型的標記表征進行對齊。

在視覺主干網絡中,蘋果采用了標準的視覺 Transformer(ViT-g),服務器模型為 10 億參數;以及更高效的 ViTDet-L 主干網絡,設備端模型為 3 億參數。

設備端視覺主干網絡采用了 ViTDet 架構,該架構在大多數視覺 Transformer 層中使用窗口注意力機制,僅包含三個跨窗口全局注意力層。為更有效地捕捉并整合細粒度局部細節與宏觀全局上下文信息,蘋果在標準 ViTDet 基礎上創新性地引入了注冊窗口(RW)機制。該機制通過讓全局注冊表(或類別)標記在參與整體全局上下文聚合前,先與圖像中的不同局部窗口進行交互,從而實現對全局特征的編碼。

蘋果認為,端側和云端模型配合可以滿足廣泛的性能和部署需求。設備端模型經過優化,能夠以最低資源消耗實現低延遲推理;而服務器端模型則專為復雜任務設計,提供了高精度和可擴展性。

在人工評估基準中,蘋果的模型在跨語言、文本和視覺模式上都具有不錯的競爭力,甚至優于同等規模的最佳開源模型。





在技術報告中,蘋果還介紹了全新推出的 Swift 核心的基礎模型框架,其中集成了引導式生成、約束式工具調用和 LoRA 適配器微調三大功能模塊,開發者僅需幾行代碼即可輕松實現這些功能的集成。

該框架讓開發者能夠借助約 30 億參數的設備端語言模型,著手打造可靠且具備量產級品質的生成式 AI 功能。作為 Apple Intelligence 的核心,它在摘要、實體提取、文本理解、優化、簡短對話、創意內容生成等多樣化文本任務中表現卓越。不過蘋果表示,雖然已針對設備端模型進行了專門優化,但它并非為通用知識問答而設計。蘋果鼓勵應用開發者利用該框架為 APP 定制實用功能。

蘋果表示,Apple Intelligence 模型的最新進展始終遵循「負責任的人工智能」的理念,通過內容過濾、地區定制評估等安全防護措施,并依托私有云計算等創新技術,切實保障用戶隱私安全。

在技術報告發布之后,龐若鳴不忘感謝了所有貢獻者,其中包括模型、后訓練、多模態、框架 / API、項目管理人員,同時把接力棒交給了蘋果 AI 的下一任負責人 Zhifeng Chen 和 Mengyu Li。



此前據媒體報道,龐若鳴加入 Meta 后,蘋果大模型團隊將由陳智峰(Zhifeng Chen)負責,不過團隊的管理架構將更加分散。

陳智峰 2000 年本科畢業于復旦大學,后于普林斯頓大學、伊利諾伊大學香檳分校獲得碩士、博士學位。在加入蘋果之前,陳智峰曾在谷歌長期工作,參與過 TensorFlow、Gemini、神經機器翻譯系統、Palm 2 等重要研究。他和龐若鳴、吳永輝均是Google Brain 早期的重要成員。



參考內容:

https://www.bloomberg.com/news/articles/2025-07-07/apple-loses-its-top-ai-models-executive-to-meta-s-hiring-spree

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
臺風韋帕來了:韋帕基本鎖定廣東登陸,珠三角或迎五年來最大臺風

臺風韋帕來了:韋帕基本鎖定廣東登陸,珠三角或迎五年來最大臺風

中國氣象愛好者
2025-07-18 21:32:24
女排隊員關系融洽:吳夢潔莊宇珊組cp,范泊寧董禹含是閨蜜

女排隊員關系融洽:吳夢潔莊宇珊組cp,范泊寧董禹含是閨蜜

金毛愛女排
2025-07-19 00:00:03
派出所回應暴走團占道逼停120和119:會聯系負責人進行批評教育

派出所回應暴走團占道逼停120和119:會聯系負責人進行批評教育

極目新聞
2025-07-18 15:12:00
川普要求公布愛潑斯坦案大陪審團證詞,質問民主黨:你們掌權時為什么不公布?佩洛西:他在轉移視線

川普要求公布愛潑斯坦案大陪審團證詞,質問民主黨:你們掌權時為什么不公布?佩洛西:他在轉移視線

紐約時間
2025-07-19 03:09:35
美國不敢公布的馬航內幕:特工隨行,頂級專家失蹤,美女意外死亡

美國不敢公布的馬航內幕:特工隨行,頂級專家失蹤,美女意外死亡

可兒故事匯
2024-09-16 01:53:56
兒女再親不如錢親!周海媚去世不到兩年,豪宅被掛急售、狗被送人

兒女再親不如錢親!周海媚去世不到兩年,豪宅被掛急售、狗被送人

新語愛八卦
2025-07-18 15:45:15
第6號臺風“韋帕”生成,路徑公布!最強可達14級!寧波人做好準備,9級雷暴大風、強雷電、強降水

第6號臺風“韋帕”生成,路徑公布!最強可達14級!寧波人做好準備,9級雷暴大風、強雷電、強降水

魯中晨報
2025-07-18 11:12:06
美要求澳大利亞表態,戰時愿意出兵臺海么?澳當局的回應斬釘截鐵

美要求澳大利亞表態,戰時愿意出兵臺海么?澳當局的回應斬釘截鐵

盒子里的密探
2025-07-19 03:04:10
揭露借債僅一天,向家困境再現?郭碧婷的豪門尊嚴遭沖擊

揭露借債僅一天,向家困境再現?郭碧婷的豪門尊嚴遭沖擊

喜歡歷史的阿繁
2025-07-19 01:03:59
小李子萊昂納多和超模的戀情得到了朋友們的支持 可能成為社媒永遠官方情侶

小李子萊昂納多和超模的戀情得到了朋友們的支持 可能成為社媒永遠官方情侶

手工制作阿殲
2025-07-19 03:23:23
韋世豪染紅離場!與球迷互罵,踩踏津門虎門將,離場后爆哭

韋世豪染紅離場!與球迷互罵,踩踏津門虎門將,離場后爆哭

奧拜爾
2025-07-18 21:39:23
第6號臺風“韋帕”最強可達14級!對蘇州的影響…

第6號臺風“韋帕”最強可達14級!對蘇州的影響…

東太湖七都在線
2025-07-18 21:43:42
伊朗徹底倒向中國,伊朗向中國低頭了,伊朗向中國求救!

伊朗徹底倒向中國,伊朗向中國低頭了,伊朗向中國求救!

欽點歷史
2025-07-18 09:26:03
大瓜!李天一豪賭輸千萬,夢鴿被限制出境,84歲李雙江被坑慘了?

大瓜!李天一豪賭輸千萬,夢鴿被限制出境,84歲李雙江被坑慘了?

壹月情感
2025-07-01 21:52:02
雙色球25081期曬票,彩友9834元復式挑戰一等獎,奇跡能否發生?

雙色球25081期曬票,彩友9834元復式挑戰一等獎,奇跡能否發生?

芭比衣櫥
2025-07-19 00:49:27
“惡魔”宗慶后的墮落之路:從對女員工下手開始,就一發不可收拾

“惡魔”宗慶后的墮落之路:從對女員工下手開始,就一發不可收拾

深析古今
2025-07-17 17:23:50
女子遭職場性侵致創傷后應激障礙被認定工傷,公司上訴遭法院駁回

女子遭職場性侵致創傷后應激障礙被認定工傷,公司上訴遭法院駁回

新京報
2025-07-18 21:14:19
俄羅斯應對的三張牌:歸還遠東領土,放棄外蒙古,唐努烏海回歸

俄羅斯應對的三張牌:歸還遠東領土,放棄外蒙古,唐努烏海回歸

阿芒娛樂說
2025-07-11 01:20:04
耳環小花被老頭子“開苞”!小黃鴨抓娃娃!

耳環小花被老頭子“開苞”!小黃鴨抓娃娃!

八卦瘋叔
2025-07-17 15:13:58
向佐欠賭債大翻盤!賭場1天急改口道歉 發聲:140萬港幣已全數償還

向佐欠賭債大翻盤!賭場1天急改口道歉 發聲:140萬港幣已全數償還

ETtoday星光云
2025-07-16 11:17:55
2025-07-19 04:27:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10898文章數 142385關注度
往期回顧 全部

科技要聞

凌晨,OpenAI重磅更新,Manus們算白忙活嗎

頭條要聞

娃哈哈員工:宗慶后曾欲將51%股份給長子 宗馥莉僅40%

頭條要聞

娃哈哈員工:宗慶后曾欲將51%股份給長子 宗馥莉僅40%

體育要聞

夏聯-楊瀚森8+8+5+3帽 開拓者大勝火箭

娛樂要聞

王琳自曝被兒子打,承認自己水性楊花

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

售30萬?方程豹鈦7高配版有激光雷達/車載無人機

態度原創

房產
游戲
藝術
時尚
公開課

房產要聞

一梯一戶純板樓!斷貨三年,海口這一核心區,硬貨出場!

Epic 免費送《文明 6 白金版》 / 《黑神話》音樂會 2025 確定巡演城市

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

這么丑的五指鞋,會是OOTD新風向嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 通江县| 屏山县| 河池市| 镶黄旗| 灵丘县| 清新县| 威信县| 五莲县| 漳浦县| 渭南市| 黑山县| 榆树市| 清苑县| 成安县| 中阳县| 斗六市| 团风县| 东至县| 杭州市| 怀安县| 九龙坡区| 贵阳市| 宕昌县| 凌源市| 城步| 凤翔县| 百色市| 贵溪市| 出国| 那曲县| 长葛市| 长治县| 广昌县| 乐亭县| 广丰县| 商南县| 衡山县| 海城市| 岳阳县| 榆林市| 永安市|