99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

首個「萬億級時間點」預訓練,清華發布生成式時序大模型日晷 | ICML Oral

0
分享至


新智元報道

編輯:LRST

【新智元導讀】清華大學軟件學院發布生成式時序大模型——日晷(Sundial)。告別離散化局限,無損處理連續值,基于流匹配生成預測,緩解預訓練模式坍塌,支持非確定性概率預測,為決策過程提供動態支持。

最近,清華大學大數據系統軟件國家工程研究中心的?項時序?模型?作被ICML 2025接受為Oral?章。


論文鏈接:https://arxiv.org/pdf/2502.00816

代碼鏈接:https://github.com/thuml/Sundial

開源模型:https://huggingface.co/thuml/sundial-base-128m

在論文剛發布時,這項工作就引起了學界和業界關注。


在HuggingFace發布一周后,日晷在時序預測板塊的Trending排名第四,下載量達6k。


HuggingFace 時序預測(Time Series Forecasting)板塊

該工作的主要貢獻如下:

  • 針對時序預測的非確定性,提出基于流匹配的預測損失函數,能根據歷史序列生成多條預測軌跡,并緩解時序大模型預訓練時的模式坍塌。

  • 構建了首個萬億時間點規模的高質量時序數據集,發布了支持零樣本預測的預訓練模型。

  • 相較統計方法和深度模型,無需專門微調在多項預測榜單取得效果突破,具備毫秒級推理速度。

時序大模型

時間序列揭示了數據隨時間的變化規律,時序預測在氣象、金融、物聯網等多個領域中發揮著重要作用。

針對時序數據的統計學習,機器學習,深度學習方法層出不窮,然而,不同方法都有各自的優勢區間

深度學習模型雖好,但在數據稀缺時容易出現性能劣化;

統計學習方法雖快,但需逐序列擬合,缺乏泛化性。


訓練數據與模型效果的規模曲線同樣適用于時序分析

最近研究旨在構建時序大模型:在大規模時序數據上預訓練,在分布外數據上預測(零樣本預測)。

由于不需要訓練,其資源開銷主要集中在推理,速度媲美 ARIMA 等統計方法,并擁有更強的泛化性。

谷歌,亞馬遜,以及 Salesforce 等公司相繼自研時序大模型,用于在特定場景下提供開箱即用預測能力

非確定性預測

目前業界的深度模型主要支持確定性預測:給定歷史序列,產生固定的預測結果。

然而,時序預測存在非確定性,對預測結果的把握取決于信息的充分程度。

深度學習以數據驅動的方式建模時序變化的隨機過程,實際觀測到的序列也是上述隨機過程的一次采樣。

因此,時序預測不光存在信息完備的難題,即使信息充分,未來結果也存在一定的不確定性

決策過程往往更需要對預測結果的風險評估(例如方差,置信度等),因此概率預測能力至關重要。

預訓練模式坍塌

概率預測并非難事

均方損失函數能建模高斯先驗的預測分布,尖點損失函數(Pinball Loss)可實現分位數預測。

然而,為時序大模型賦予概率預測能力充滿挑戰:大規模時序數據往往呈現復雜多峰分布——相似的歷史序列,在不同領域/樣本中可能出現完全不同的未來變化


時序預測的非確定性來自時序數據的分布異構性。時序數據還存在其他異構性:例如維度異構,語義異構等。目前時序大模型尚處于如何有效處理時序數據異構性的階段

在大規模時序數據的復雜異構分布上訓練,以往模型往往給出「過平滑」的預測結果(上圖右)。

雖然從優化目標來看,該結果是全局最優的,但預測結果沒有提供實際有效的信息。

作者團隊將該現象稱為時序模型「模式坍塌」,源自使用帶先驗的損失函數,限制了模型的假設空間 (Hypotheses Space)。

為緩解模式坍塌,Moirai使用混合分布處理模棱兩可的預測情況。然而,混合分布依然引入了概率先驗,不夠靈活。

亞馬遜Chronos將時間序列離散化,使用交叉熵優化學習弱先驗的多峰概率分布。

但是,交叉熵損失依賴離散化,存在精度損失和詞表外泛化(Out-of-Vocabulary)等問題,不夠原生。


日晷相較此前時序大模型的區別:(1)時序原生性:無需離散化,使用 Transformer 直接編碼連續時間值,突破語言建模(Language Modeling)(2)分布靈活性:不引入分布先驗,基于生成模型學習靈活的數據分布,突破參數先驗(Parametric Densities)

針對原生性和靈活性的矛盾,該工作深入原生連續編碼生成式建模,提出首個基于流匹配的生成式時序大模型。

無需離散化,在連續值序列上進行處理和預測;無需假定預測分布,釋放模型對大規模時序數據的學習能力。

時序Transformer+流匹配生成

日晷模型主體為可擴展Transformer,使用重歸一化,分塊嵌入和多分塊預測等技術適配時序數據特性,并融入了FlashAttention,KV Cache等進行效率優化


日晷可視作一種ARMA模型(自回歸和與移動平均):Transformer自回歸地學習任意長度的時間序列表征;基于該表征,時間流(TimeFlow)將隨機噪聲轉換為非確定性預測結果

基于Transformer提取的上下文表征,研究人員提出時間流預測損失(TimeFlow Loss),將歷史序列表征作為生成條件引入到流匹配過程中

流匹配是生成式建模的前沿技術,通過學習速度場,將簡單分布變換為任意復雜分布,從簡單分布中采樣隨機噪聲,能夠生成服從復雜分布的樣本。

所提出的損失函數不引入任何概率先驗,模型將采樣隨機性引入訓練過程,擴展了預測分布的假設空間,增強了模型的擬合能力,使其能更加靈活地處理時序數據的分布異構性,

推理時,通過多次從簡單分布中采樣,模型能夠生成多條符合歷史變化的預測軌跡;基于多條預測樣本,能夠構建預測序列的分布,從而估計預測值,方差和置信區間等。


日晷可多次采樣生成未來可能出現的情況,隱式構建預測值的概率分布,使用者可在此基礎上計算關心的分布指標,或者引入反饋信號進行調優

萬億時間點預訓練

該工作構建了領域最大的時序數據集TimeBench,由真實數據和合成數據構成,覆蓋氣象、金融、交通、能源、物聯網等多個領域,包含小時到日度等多種采樣頻率和預測時效,總計萬億(10^12)時間點


TimeBench 由大量真實數據和少量合成數據組成,覆蓋多種時序預測的應用相關領域

在萬億數據基礎上,模型在擴展的數據量/參數規模中預訓練,驗證了生成式時序大模型的「規模定律」


不同參數規模的模型訓練曲線

預測榜單效果

日晷在多項榜單中進行了測試,涵蓋多種輸入輸出長度,包含點預測以及概率預測場景:

  • GIFT-Eval 榜單:日晷的零樣本預測能力超過此前Chronos,Moirai,以及分布內訓練的深度模型


GIFT-Eval 為 Salesforce 發布的預測榜單,包含24個數據集,超過144,000個時間序列和1.77億個數據點,跨越7個領域,10種頻率,涵蓋多變量,短期和長期的預測場景

  • FEV 榜單:日晷大幅超過 ARIMA 等統計方法,取得了與 Chronos 相當的效果,僅需1/35的推理時間。


GIFT-Eval 為 AutoGluon 發布的預測榜單,包含27個數據集,指標從左到右依次為:概率預測(WQL),點預測(MASE)和推理時間(ms)

  • Time-Series-Library 榜單:日晷取得了第一的零樣本預測效果,隨參數規模擴大,效果持續提升


開箱即用模型

目前 HuggingFace 上開源了基礎模型,僅需不到十行代碼,就可調用模型進行零樣本預測,并提供了均值預測,分位數預測,置信區間預測等示例。


模型可在CPU上直接推理,生成多條預測結果的時間不到一秒。


總結與展望

日晷結合了連續值編碼、Transformer和生成式預測目標,緩解了時序數據預訓練的模式坍塌問題。通過萬億規模預訓練和工程效率優化,模型提供了開箱即用預測能力和毫秒級推理速度。

所提出的生成式預測范式有望擴展時序模型的應用前景,使其成為許多行業的決策工具。

未來,該工作計劃探索在多變量預測場景下的訓練和微調技術,融入特定場景下的機理知識和決策反饋,進一步釋放時序大模型的泛化性和可控性。

參考資料:

https://arxiv.org/abs/2502.00816


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
那爾那茜,調查結果正式公布!

那爾那茜,調查結果正式公布!

藍鉆故事
2025-06-21 23:58:12
吃霸王婚宴的錢總“社會性死亡”了,生意被曝,新婚女兒也被連累

吃霸王婚宴的錢總“社會性死亡”了,生意被曝,新婚女兒也被連累

知鑒明史
2025-06-19 16:42:38
荔枝的“死對頭”,醫生提醒:二者萬不可同吃,吃荔枝禁忌要牢記

荔枝的“死對頭”,醫生提醒:二者萬不可同吃,吃荔枝禁忌要牢記

阿龍美食記
2025-06-16 15:19:56
特朗普服軟了?6枚重型鉆地彈落地后,美國向伊朗做出兩大保證

特朗普服軟了?6枚重型鉆地彈落地后,美國向伊朗做出兩大保證

涼羽亭
2025-06-22 10:43:54
唯品會副總裁因貪腐問題被調查,在公司工作超十年,曾主導周杰倫出任CJO項目

唯品會副總裁因貪腐問題被調查,在公司工作超十年,曾主導周杰倫出任CJO項目

紅星資本局
2025-06-22 16:29:04
餐館無償為拾荒老人提供8年午餐,店快倒閉時,老人搬來一個箱子

餐館無償為拾荒老人提供8年午餐,店快倒閉時,老人搬來一個箱子

五元講堂
2025-06-18 15:02:24
發現一個悲哀的現象:特別長壽的老人,幾乎都是子女用生命在托舉

發現一個悲哀的現象:特別長壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
一場0:3完敗后,中國女排卻收獲3大利好消息 董禹含一戰成名

一場0:3完敗后,中國女排卻收獲3大利好消息 董禹含一戰成名

說說史事
2025-06-22 22:41:09
“難怪小學女老師,十個有九個單身”,一段聊天記錄,揭露了真相

“難怪小學女老師,十個有九個單身”,一段聊天記錄,揭露了真相

妍妍教育日記
2025-06-03 20:00:38
從7月起,需做好“潮水退去”后的準備?房地產或將出現5個趨勢

從7月起,需做好“潮水退去”后的準備?房地產或將出現5個趨勢

平說財經
2025-06-21 07:14:09
72老太一輩子沒結婚,病重住院后中年男子趕來:媽,我們來了

72老太一輩子沒結婚,病重住院后中年男子趕來:媽,我們來了

雨仔講故事
2025-05-17 18:53:05
其實,很多單位已經爛透了!

其實,很多單位已經爛透了!

大道微言
2025-06-16 20:00:39
醫院生娃,孩子頭直接被醫生拔掉了?父母請專家尸檢,結果專家直接把圖發網上了?!

醫院生娃,孩子頭直接被醫生拔掉了?父母請專家尸檢,結果專家直接把圖發網上了?!

英國那些事兒
2025-06-22 23:16:00
為什么說對大自然要保持敬畏之心,看完網友的各種分享,讓人后怕

為什么說對大自然要保持敬畏之心,看完網友的各種分享,讓人后怕

熱鬧的河馬
2024-11-01 14:00:16
即將HWG!羅馬諾:32歲博格巴自由加盟摩納哥,時隔兩年再就業!

即將HWG!羅馬諾:32歲博格巴自由加盟摩納哥,時隔兩年再就業!

直播吧
2025-06-23 02:28:30
外交部發布雙語視頻回家: 縱有萬里歸途 ,祖國一定接你回家

外交部發布雙語視頻回家: 縱有萬里歸途 ,祖國一定接你回家

每日經濟新聞
2025-06-22 16:10:23
某局大崩潰:管理人員都發不出工資了!

某局大崩潰:管理人員都發不出工資了!

黯泉
2025-06-11 22:00:11
陳羽凡現狀:低調生活,50歲胖到認不出,17歲兒子1米8長得像媽

陳羽凡現狀:低調生活,50歲胖到認不出,17歲兒子1米8長得像媽

果娛
2025-05-14 12:19:32
違規吃喝標準確定!杜絕“一刀切”式整治,誰亂加碼誰擔責

違規吃喝標準確定!杜絕“一刀切”式整治,誰亂加碼誰擔責

王五說說看
2025-06-22 16:07:36
A股:大家要做好心理預期,明天(6月23日),股市很可能這樣變化

A股:大家要做好心理預期,明天(6月23日),股市很可能這樣變化

財經大拿
2025-06-22 07:10:07
2025-06-23 02:51:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12929文章數 66077關注度
往期回顧 全部

科技要聞

"你應該靠嘴吃飯",羅永浩自述被梁文鋒勸退

頭條要聞

伊朗投入5萬億美元的核項目遭摧毀 哈梅內伊面臨抉擇

頭條要聞

伊朗投入5萬億美元的核項目遭摧毀 哈梅內伊面臨抉擇

體育要聞

中國女排0-3意大利 香港站3勝1負收官

娛樂要聞

離婚四年!趙麗穎被曝新戀情惹爭議

財經要聞

蘋果后院起火

汽車要聞

首搭華為雙王牌/6月24日預售 嵐圖FREE+正式下線

態度原創

手機
健康
數碼
教育
旅游

手機要聞

華為鴻蒙 HarmonyOS 5.0.1.130 版本游戲場景新增“高性能”模式

呼吸科專家破解呼吸道九大謠言!

數碼要聞

曝索尼PS6將采用全新AMD架構:光追、AI性能翻倍

教育要聞

2026qs排名完整名單公布后,申請難度會暴漲的幾所英國大學!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 郧西县| 靖江市| 隆德县| 临城县| 威远县| 岢岚县| 通许县| 大田县| 新丰县| 梓潼县| 南木林县| 当涂县| 卢龙县| 平湖市| 济南市| 洛扎县| 乌拉特中旗| 衡水市| 大冶市| 三穗县| 威宁| 云安县| 绩溪县| 仙游县| 娄烦县| 衡山县| 乌拉特中旗| 东港市| 巴塘县| 祁连县| 克东县| 隆回县| 青海省| 安平县| 田东县| 三门峡市| 古田县| 平度市| 胶南市| 昂仁县| 宜君县|