99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<center id="qtpsg"><i id="qtpsg"></i></center>

<sub id="qtpsg"><p id="qtpsg"></p></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

首個「萬億級時間點」預訓練，清華發布生成式時序大模型日晷 | ICML Oral

2025-06-20 12:09:51　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：LRST

【新智元導讀】清華大學軟件學院發布生成式時序大模型——日晷（Sundial）。告別離散化局限，無損處理連續值，基于流匹配生成預測，緩解預訓練模式坍塌，支持非確定性概率預測，為決策過程提供動態支持。

最近，清華大學大數據系統軟件國家工程研究中心的?項時序?模型?作被ICML 2025接受為Oral?章。

論文鏈接：https://arxiv.org/pdf/2502.00816

代碼鏈接：https://github.com/thuml/Sundial

開源模型：https://huggingface.co/thuml/sundial-base-128m

在論文剛發布時，這項工作就引起了學界和業界關注。

在HuggingFace發布一周后，日晷在時序預測板塊的Trending排名第四，下載量達6k。

HuggingFace 時序預測（Time Series Forecasting）板塊

該工作的主要貢獻如下：

針對時序預測的非確定性，提出基于流匹配的預測損失函數，能根據歷史序列生成多條預測軌跡，并緩解時序大模型預訓練時的模式坍塌。
構建了首個萬億時間點規模的高質量時序數據集，發布了支持零樣本預測的預訓練模型。
相較統計方法和深度模型，無需專門微調在多項預測榜單取得效果突破，具備毫秒級推理速度。

時序大模型

時間序列揭示了數據隨時間的變化規律，時序預測在氣象、金融、物聯網等多個領域中發揮著重要作用。

針對時序數據的統計學習，機器學習，深度學習方法層出不窮，然而，不同方法都有各自的優勢區間：

深度學習模型雖好，但在數據稀缺時容易出現性能劣化；

統計學習方法雖快，但需逐序列擬合，缺乏泛化性。

訓練數據與模型效果的規模曲線同樣適用于時序分析

最近研究旨在構建時序大模型：在大規模時序數據上預訓練，在分布外數據上預測（零樣本預測）。

由于不需要訓練，其資源開銷主要集中在推理，速度媲美 ARIMA 等統計方法，并擁有更強的泛化性。

谷歌，亞馬遜，以及 Salesforce 等公司相繼自研時序大模型，用于在特定場景下提供開箱即用預測能力。

非確定性預測

目前業界的深度模型主要支持確定性預測：給定歷史序列，產生固定的預測結果。

然而，時序預測存在非確定性，對預測結果的把握取決于信息的充分程度。

深度學習以數據驅動的方式建模時序變化的隨機過程，實際觀測到的序列也是上述隨機過程的一次采樣。

因此，時序預測不光存在信息完備的難題，即使信息充分，未來結果也存在一定的不確定性。

決策過程往往更需要對預測結果的風險評估（例如方差，置信度等），因此概率預測能力至關重要。

預訓練模式坍塌

概率預測并非難事

均方損失函數能建模高斯先驗的預測分布，尖點損失函數（Pinball Loss）可實現分位數預測。

然而，為時序大模型賦予概率預測能力充滿挑戰：大規模時序數據往往呈現復雜多峰分布——相似的歷史序列，在不同領域/樣本中可能出現完全不同的未來變化。

時序預測的非確定性來自時序數據的分布異構性。時序數據還存在其他異構性：例如維度異構，語義異構等。目前時序大模型尚處于如何有效處理時序數據異構性的階段

在大規模時序數據的復雜異構分布上訓練，以往模型往往給出「過平滑」的預測結果（上圖右）。

雖然從優化目標來看，該結果是全局最優的，但預測結果沒有提供實際有效的信息。

作者團隊將該現象稱為時序模型「模式坍塌」，源自使用帶先驗的損失函數，限制了模型的假設空間 (Hypotheses Space)。

為緩解模式坍塌，Moirai使用混合分布處理模棱兩可的預測情況。然而，混合分布依然引入了概率先驗，不夠靈活。

亞馬遜Chronos將時間序列離散化，使用交叉熵優化學習弱先驗的多峰概率分布。

但是，交叉熵損失依賴離散化，存在精度損失和詞表外泛化（Out-of-Vocabulary）等問題，不夠原生。

日晷相較此前時序大模型的區別：（1）時序原生性：無需離散化，使用 Transformer 直接編碼連續時間值，突破語言建模（Language Modeling）（2）分布靈活性：不引入分布先驗，基于生成模型學習靈活的數據分布，突破參數先驗（Parametric Densities）

針對原生性和靈活性的矛盾，該工作深入原生連續編碼和生成式建模，提出首個基于流匹配的生成式時序大模型。

無需離散化，在連續值序列上進行處理和預測；無需假定預測分布，釋放模型對大規模時序數據的學習能力。

時序Transformer+流匹配生成

日晷模型主體為可擴展Transformer，使用重歸一化，分塊嵌入和多分塊預測等技術適配時序數據特性，并融入了FlashAttention，KV Cache等進行效率優化。

日晷可視作一種ARMA模型（自回歸和與移動平均）：Transformer自回歸地學習任意長度的時間序列表征；基于該表征，時間流（TimeFlow）將隨機噪聲轉換為非確定性預測結果

基于Transformer提取的上下文表征，研究人員提出時間流預測損失（TimeFlow Loss），將歷史序列表征作為生成條件引入到流匹配過程中。

流匹配是生成式建模的前沿技術，通過學習速度場，將簡單分布變換為任意復雜分布，從簡單分布中采樣隨機噪聲，能夠生成服從復雜分布的樣本。

所提出的損失函數不引入任何概率先驗，模型將采樣隨機性引入訓練過程，擴展了預測分布的假設空間，增強了模型的擬合能力，使其能更加靈活地處理時序數據的分布異構性，

推理時，通過多次從簡單分布中采樣，模型能夠生成多條符合歷史變化的預測軌跡；基于多條預測樣本，能夠構建預測序列的分布，從而估計預測值，方差和置信區間等。

日晷可多次采樣生成未來可能出現的情況，隱式構建預測值的概率分布，使用者可在此基礎上計算關心的分布指標，或者引入反饋信號進行調優

萬億時間點預訓練

該工作構建了領域最大的時序數據集TimeBench，由真實數據和合成數據構成，覆蓋氣象、金融、交通、能源、物聯網等多個領域，包含小時到日度等多種采樣頻率和預測時效，總計萬億（10^12）時間點。

TimeBench 由大量真實數據和少量合成數據組成，覆蓋多種時序預測的應用相關領域

在萬億數據基礎上，模型在擴展的數據量/參數規模中預訓練，驗證了生成式時序大模型的「規模定律」。

不同參數規模的模型訓練曲線

預測榜單效果

日晷在多項榜單中進行了測試，涵蓋多種輸入輸出長度，包含點預測以及概率預測場景：

GIFT-Eval 榜單：日晷的零樣本預測能力超過此前Chronos，Moirai，以及分布內訓練的深度模型。

GIFT-Eval 為 Salesforce 發布的預測榜單，包含24個數據集，超過144,000個時間序列和1.77億個數據點，跨越7個領域，10種頻率，涵蓋多變量，短期和長期的預測場景

FEV 榜單：日晷大幅超過 ARIMA 等統計方法，取得了與 Chronos 相當的效果，僅需1/35的推理時間。

GIFT-Eval 為 AutoGluon 發布的預測榜單，包含27個數據集，指標從左到右依次為：概率預測（WQL），點預測（MASE）和推理時間（ms）

Time-Series-Library 榜單：日晷取得了第一的零樣本預測效果，隨參數規模擴大，效果持續提升。

開箱即用模型

目前 HuggingFace 上開源了基礎模型，僅需不到十行代碼，就可調用模型進行零樣本預測，并提供了均值預測，分位數預測，置信區間預測等示例。

模型可在CPU上直接推理，生成多條預測結果的時間不到一秒。

總結與展望

日晷結合了連續值編碼、Transformer和生成式預測目標，緩解了時序數據預訓練的模式坍塌問題。通過萬億規模預訓練和工程效率優化，模型提供了開箱即用預測能力和毫秒級推理速度。

所提出的生成式預測范式有望擴展時序模型的應用前景，使其成為許多行業的決策工具。

未來，該工作計劃探索在多變量預測場景下的訓練和微調技術，融入特定場景下的機理知識和決策反饋，進一步釋放時序大模型的泛化性和可控性。

參考資料：

https://arxiv.org/abs/2502.00816

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

數據減少超千倍，500 美金訓練一流視頻模型，港城、華為Pusa來了

機器之心Pro 2025-06-19 15:33:17
0 跟貼 0
中科大與華為提出首個生成式多階段統一框架，性能全面超越 SOTA

機器之心Pro 2025-06-20 19:36:00
2 跟貼 2

拿了火星圖片的華為云盤古大模型，這樣在地球落地

量子位 2025-06-20 19:05:56
2 跟貼 2

10×加速！DCM提升推理效率！HunyuanVideo13B推理時間縮短至120秒

機器之心Pro 2025-06-18 17:30:03
0 跟貼 0
北大團隊制備高質量單晶薄膜，遷移率創紀錄突破15.5cm2/V·s

DeepTech深科技 2025-06-20 17:57:04
0 跟貼 0

郎咸平：談伊以沖突，分析透徹！終于等到郎教授說伊以的事兒了！

長河小吏 2025-06-20 07:45:03
7628 跟貼 7628

GPT微調后竟教人自殺，OpenAI發現AI黑化真相，預訓練時就埋了雷

DeepTech深科技 2025-06-20 10:11:15
4 跟貼 4
5歲兒子走丟，女子慌張哭泣，巡邏城管出手相助

環球網資訊 2025-06-20 11:31:02
337 跟貼 337

清華SageAttention3，FP4量化5倍加速！且首次支持8比特訓練

機器之心Pro 2025-06-18 20:00:34
1 跟貼 1
復旦&微軟開源StableAnimator: 首個端到端ID一致性人類視頻生成

機器之心Pro 2025-03-19 17:41:41
0 跟貼 0
單GPU搞定高清長視頻生成，效率×10！引入Mamba機制突破DiT瓶頸

量子位 2025-06-18 16:51:19
0 跟貼 0
昆明南博會公眾開放首日！機器狗換新“皮膚”化身“機器獅”，互動賣萌超可愛

開屏新聞客戶端 2025-06-20 13:45:01
0 跟貼 0
伊朗亮出神秘新型導彈？以色列上空出現軌跡云，這次攻擊真不簡單

桔子看軍視 2025-06-19 16:58:09
0 跟貼 0
川普：敢動一個美國人，我就嘎了你

迎風立調侃 2025-06-20 09:22:40
3814 跟貼 3814
市場監管總局公布最新一批重點實驗室和技術創新中心驗收結果

證券時報 2025-06-19 14:53:06
0 跟貼 0
安徽宿州哄搶土豆事件，當地村民站出來發聲，聽聽他說的！

中書省的世界觀 2025-06-20 07:14:49
3299 跟貼 3299
80后華人零融資創業：1/10人力營收規模超Scale AI，谷歌OpenAI大模型的“秘密武器”

智東西 2025-06-20 21:15:39
0 跟貼 0
真正的智能體軟件工程師：OpenAI研發A-SWE能寫代碼、測試質量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0
圖像分詞器造反了！華為 Selftok：自回歸內核完美統一擴散模型

機器之心Pro 2025-05-22 10:38:46
0 跟貼 0
對話退學北大又考上清華的河南小伙：我有點狂妄，不是一個好學生，為改善家人生活而努力學習

極目新聞 2025-06-20 15:14:23
2455 跟貼 2455
弈客簽約 | 永遠也走不出的一選

弈客圍棋 2025-06-20 21:39:02
0 跟貼 0
這么好的機器人，誰不想擁有一個

兔八哥影視 2025-06-20 10:19:23
1 跟貼 1
機器狗可能是搜救的未來嗎？為幸存者帶來安全工具包

世界生活點滴 2025-06-16 12:03:22
0 跟貼 0
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
從戰場到工地，消失的41萬鐵軍：鐵道兵為何退出解放軍序列？

深度看歷史 2025-06-19 13:28:55
0 跟貼 0
生成式AI的架構設計需確保支撐十萬至千萬級DAU

量子位 2025-04-23 17:09:24
0 跟貼 0
國產SOTA新模型精準get“畫(3+6)條命的動物” | 開源

量子位 2025-06-20 16:05:39
0 跟貼 0
數字果蠅登上Nature，能自主飛行、行走

量子位 2025-04-28 16:32:04
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
AI理解語言的終極密碼，千問3向量模型開源，性能超谷歌OpenAI

機器之心Pro 2025-06-11 19:17:56
0 跟貼 0
百萬年薪的AI崗位，2年就徹底涼透了？

量子位 2025-05-04 12:34:36
0 跟貼 0
明查｜印度波音787墜機原因是“機長座椅滑動”？尚無證據

澎湃新聞 2025-06-20 07:26:30
484 跟貼 484
把280萬篇論文繪制成星空，探索知識最浪漫的方式之一

量子位 2025-05-20 18:25:54
0 跟貼 0
為了讓電腦上的數學公式更好看，這件事折騰了快50年

量子位 2025-05-30 11:32:17
0 跟貼 0
MWC上海觀察 | 聚焦“行業互聯”：5G與AI融合驅動產業革新

通信世界 2025-06-20 21:38:17
0 跟貼 0
十幾萬人圍觀的AI課：打造全自動Web Agent

量子位 2025-04-21 22:37:59
0 跟貼 0
MIT校友力壓Scale AI，創建AI公司五年零融資，盈利超10億美元

DeepTech深科技 2025-06-20 18:14:22
0 跟貼 0
小學數學題找規律，沒有思路，不知道用什么方法去做

公考客棧店小二 2025-06-16 10:00:00
33 跟貼 33
大模型亂試錯、盲調用？KnowSelf讓智能體有「知識邊界感知」能力

機器之心Pro 2025-05-21 16:32:57
1 跟貼 1
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

火藥味來了！韋世豪一腳解圍踢到澤卡身上，雙方爆發沖突

火藥味來了！韋世豪一腳解圍踢到澤卡身上，雙方爆發沖突

直播吧

2025-06-20 21:01:31

重磅！威馬被收購！

電動知家

2025-06-20 10:16:51

A股：經濟日報最新發文，系好安全帶，下周將迎來更大級別變盤！

A股：經濟日報最新發文，系好安全帶，下周將迎來更大級別變盤！

二月侃事

2025-06-20 20:07:03

官方認證！梅西加冕FIFA賽事歷史射手王，10屆40場25球11助奪5冠

官方認證！梅西加冕FIFA賽事歷史射手王，10屆40場25球11助奪5冠

直播吧

2025-06-20 12:33:17

佩通坦回應電話錄音！穿皇家黃polo衫致敬泰王，皮塔卡是她支持者

佩通坦回應電話錄音！穿皇家黃polo衫致敬泰王，皮塔卡是她支持者

嘆知

2025-06-20 10:52:31

王晶的言論再次成為全國熱搜，廣東網友：確實沒有人有這樣的資格

王晶的言論再次成為全國熱搜，廣東網友：確實沒有人有這樣的資格

農村教育光哥

2025-06-19 10:18:38

兒子考上985父母卻跳樓,銀行卡余額350萬,留遺言：沒有活著的希望

兒子考上985父母卻跳樓,銀行卡余額350萬,留遺言：沒有活著的希望

嘉琪Feel

2025-06-20 10:49:19

中央第三指導組調整為指導督導湖北，組長劉家義：堅決杜絕過關思想、“一陣風”思想

中央第三指導組調整為指導督導湖北，組長劉家義：堅決杜絕過關思想、“一陣風”思想

政知新媒體

2025-06-20 18:59:07

心疼！46歲周杰倫疾病纏身，走路緩慢需要人扶，曾仕強的話說對了

心疼！46歲周杰倫疾病纏身，走路緩慢需要人扶，曾仕強的話說對了

洲洲影視娛評

2025-06-20 21:23:53

諾貝爾獎認證細胞自噬！餓12小時細胞開始自我修復，能延壽30%？

諾貝爾獎認證細胞自噬！餓12小時細胞開始自我修復，能延壽30%？

涵豆說娛

2025-06-17 18:17:45

楊瀚森落選小綠屋只因兩點，蘇群的含金量還在上升

楊瀚森落選小綠屋只因兩點，蘇群的含金量還在上升

姜大叔侃球

2025-06-20 11:20:52

視頻丨伊朗稱“真實承諾-3”第十七階段行動在以色列全境展開

視頻丨伊朗稱“真實承諾-3”第十七階段行動在以色列全境展開

環球網資訊

2025-06-20 23:51:08

劉愷威回香港參加同學聚會，換了發型好精神，男同學中樣貌最年輕

劉愷威回香港參加同學聚會，換了發型好精神，男同學中樣貌最年輕

界史

2025-06-20 11:40:23

即將畢業季，大學出現怪象：找不到工作的人，竟不是躺平、掛科的

即將畢業季，大學出現怪象：找不到工作的人，竟不是躺平、掛科的

明月聊史

2025-06-20 17:09:59

重要通知！全國各地高考錄取線預測公布，是否會出現大幅下降？

重要通知！全國各地高考錄取線預測公布，是否會出現大幅下降？

妍妍教育日記

2025-06-20 20:15:17

伊朗人為什么不愛國了？

小院之觀

2025-06-19 05:30:03

伊朗外長開始就核問題與英法德舉行會談

伊朗外長開始就核問題與英法德舉行會談

界面新聞

2025-06-20 22:19:35

拖欠員工工資被要求整改仍逾期不付，一國企在西安被行政處罰

拖欠員工工資被要求整改仍逾期不付，一國企在西安被行政處罰

上游新聞

2025-06-20 21:52:08

爆料稱iPhone 18 Pro將迎屏幕變革，靈動島或成歷史

爆料稱iPhone 18 Pro將迎屏幕變革，靈動島或成歷史

環球網資訊

2025-06-20 11:05:17

再創新高！2025浙江高考數學平均分出爐，詳情分析

再創新高！2025浙江高考數學平均分出爐，詳情分析

史海流年號

2025-06-20 20:56:37

AI產業主平臺領航智能+時代

12917文章數 66073關注度

往期回顧全部

科技要聞

余承東：鴻蒙6主打"毫秒級"時延與全面AI

頭條要聞

媒體：佩通坦錄音泄密一聲"叔叔"恐致其聯合政府瓦解

頭條要聞

媒體：佩通坦錄音泄密一聲"叔叔"恐致其聯合政府瓦解

體育要聞

周通：2年前想過退役，沒想到能踢世俱杯

娛樂要聞

黃曉明落榜原因曝光！葉珂曾秀幸福

財經要聞

58同城一邊裁員一邊跨界投資

汽車要聞

五項訂車禮/四款車型一汽奧迪A5L正式開啟預售

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

旅游

家居

游戲

藝術

教育要聞

大暴雨！7-9級雷暴大風！明日中考請提前出門！

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

家居要聞

山水之間墨染風雨云間

溫暖明亮三代同堂之家
輕奢簡約大戶型三代之家
遠行而歸臺式極簡布局

外媒談Xbox次世代主機：從此與Windows再無隔閡

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：太湖县| 珲春市| 呼图壁县| 海淀区| 宁强县| 孙吴县| 化德县| 浦东新区| 丰城市| 互助| 共和县| 沙洋县| 云林县| 东台市| 高清| 伊宁县| 浙江省| 沂源县| 富源县| 溧阳市| 永州市| 上虞市| 龙泉市| 团风县| 贵港市| 萨迦县| 阿尔山市| 石泉县| 四子王旗| 乌兰浩特市| 颍上县| 涟源市| 南雄市| 南安市| 通化县| 邵阳市| 阿克陶县| 南皮县| 呼和浩特市| 孝义市| 蚌埠市|

<sub id="zho8l"></sub>

<thead id="zho8l"><rt id="zho8l"></rt></thead>