99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

字節(jié)跳動(dòng)&清華大學(xué)開(kāi)源多模態(tài)時(shí)序大模型,實(shí)現(xiàn)時(shí)序數(shù)據(jù)對(duì)話推理

0
分享至



該工作由字節(jié)跳動(dòng) ByteBrain 團(tuán)隊(duì) × 清華大學(xué)合作完成。第一作者為清華大學(xué)三年級(jí)博士生謝哲,主要研究方向?yàn)闀r(shí)序多模態(tài) LLM、異常檢測(cè)和根因定位。第二作者和第三作者分別為李則言和何曉,均來(lái)自字節(jié)跳動(dòng)。通訊作者分別為字節(jié)跳動(dòng)研究科學(xué)家張鐵贏和清華大學(xué)計(jì)算機(jī)系副教授裴丹。

近年來(lái),多模態(tài)大語(yǔ)言模型(MLLM)發(fā)展迅速,并在圖像、視頻、音頻等領(lǐng)域取得了突破性成果。然而,相較于這些研究較為成熟的模態(tài),時(shí)間序列這一類型的數(shù)據(jù)與大模型結(jié)合的系統(tǒng)研究卻較為匱乏。

盡管已經(jīng)有 TimeLLM 等工作嘗試將 LLM 應(yīng)用于時(shí)序任務(wù),但這些研究大多局限于預(yù)測(cè)類任務(wù),無(wú)法滿足更復(fù)雜的理解與推理需求。隨著 LLM 在 AIOps、金融等需要處理時(shí)序數(shù)據(jù)的應(yīng)用場(chǎng)景中應(yīng)用愈發(fā)廣泛,時(shí)序問(wèn)答、推理的能力已成為多模態(tài)智能系統(tǒng)的一項(xiàng)基礎(chǔ)能力需求。

為此,我們提出了 ChatTS,一種原生支持多變量時(shí)序問(wèn)答與推理的多模態(tài) LLM。ChatTS 引來(lái)了HuggingFace 產(chǎn)品負(fù)責(zé)人 Victor Mustar,以及 SparkNLP 項(xiàng)目負(fù)責(zé)人 Maziyar Panahi等人的轉(zhuǎn)發(fā)和點(diǎn)贊:





ChatTS 論文已經(jīng)成功入選數(shù)據(jù)庫(kù)頂級(jí)會(huì)議 VLDB 2025。



  • 論文標(biāo)題:ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning
  • 論文 arXiv 鏈接:https://arxiv.org/pdf/2412.03104
  • ChatTS 代碼和數(shù)據(jù)集:https://github.com/NetmanAIOps/ChatTS
  • 模型參數(shù):https://huggingface.co/bytedance-research/ChatTS-14B

什么是時(shí)序問(wèn)答任務(wù)



傳統(tǒng)的時(shí)間序列分析方法多基于統(tǒng)計(jì)模型或 AI 模型,而這些方法通常需要大量任務(wù)特定的訓(xùn)練、特定的數(shù)據(jù)預(yù)處理和結(jié)構(gòu)化的輸入輸出,缺乏通用性和可解釋性。而 LLM 的強(qiáng)語(yǔ)言建模能力和泛化推理能力,為「用自然語(yǔ)言理解時(shí)間序列」提供了可能。

然而,目前主流的 LLM 并不能直接處理原始的時(shí)間序列數(shù)組數(shù)據(jù),現(xiàn)有工作要么將時(shí)間序列轉(zhuǎn)成文本、圖像輸入,要么依賴 agent 工具進(jìn)行間接分析,但都存在不同程度的限制。

因此,我們思考,是否可以構(gòu)建一種「時(shí)間序列原生」的多模態(tài) LLM,使其像處理圖像一樣,能夠原生地理解時(shí)間序列的形狀、波動(dòng)與語(yǔ)義含義,并進(jìn)行進(jìn)一步的問(wèn)答和推理

構(gòu)建時(shí)間序列多模態(tài)大模型面臨諸多挑戰(zhàn)

  • 數(shù)據(jù)稀缺。與圖文、語(yǔ)音等領(lǐng)域不同,時(shí)間序列+文本的對(duì)齊數(shù)據(jù)非常有限。
  • 時(shí)間序列具有高度結(jié)構(gòu)性。時(shí)序包含豐富的趨勢(shì)、周期、局部波動(dòng)、噪聲等形態(tài)特征。
  • 時(shí)間序列輸入往往是多變量、不同長(zhǎng)度的。變量之間的關(guān)系極具分析價(jià)值,但也加大了理解難度。
  • 現(xiàn)有的評(píng)估基準(zhǔn)未覆蓋時(shí)間序列多模態(tài)建模任務(wù),這也為訓(xùn)練和評(píng)估增加了難度。

現(xiàn)有方法

我們將現(xiàn)有嘗試將 LLM 應(yīng)用于時(shí)間序列的方式歸為三類:文本化方法、圖像化方法與 agent 方法。



  • 文本化(Text-Based)方法最為直接,即將時(shí)間序列值編碼成長(zhǎng)文本輸入 LLM。其可能存在顯著的上下文長(zhǎng)度限制,且無(wú)法處理多變量場(chǎng)景。
  • 圖像化(Vision-Based)方法借助可視化圖像輸入視覺(jué)大模型,但面臨圖像細(xì)節(jié)丟失的問(wèn)題。
  • Agent 方法(Agent-Based)利用 LLM 調(diào)用工具獲取特征,但該方式嚴(yán)重依賴工具準(zhǔn)確性、推理鏈條極長(zhǎng)且容易出現(xiàn)幻覺(jué)。

ChatTS: 基于合成數(shù)據(jù)訓(xùn)練的時(shí)序多模態(tài) LLM

面對(duì)時(shí)間序列與語(yǔ)言對(duì)齊數(shù)據(jù)的極度匱乏問(wèn)題,我們從根本上摒棄了依賴真實(shí)數(shù)據(jù)標(biāo)注的路徑,而是選擇「純合成驅(qū)動(dòng)」的方式,設(shè)計(jì)出一個(gè)端到端的數(shù)據(jù)生成、模型訓(xùn)練框架。

一、屬性驅(qū)動(dòng)(Attribute-Based)的時(shí)間序列生成



我們定義了一套詳細(xì)的時(shí)間序列屬性體系,這些屬性具有明確的語(yǔ)義與參數(shù),構(gòu)成了「屬性池」。每個(gè)時(shí)間序列由若干屬性組合生成,并對(duì)應(yīng)一段高質(zhì)量自然語(yǔ)言描述。這種組合方式不僅確保了生成時(shí)間序列的多樣性與真實(shí)性,還能精確對(duì)應(yīng)語(yǔ)言文本的細(xì)節(jié)表達(dá),避免了傳統(tǒng)「圖文描述不符」的問(wèn)題。

二、Time Series Evol-Instruct

僅有靜態(tài)屬性描述還不夠,我們還需訓(xùn)練模型掌握復(fù)雜的提問(wèn)、比較與推理能力。我們提出 TSEvol,該方法以一組基礎(chǔ) Q&A 為種子,依托已有 attribute pools,不斷演化出多種新問(wèn)題形式,優(yōu)化復(fù)雜推理場(chǎng)景下的模型能力。

三、原生多模態(tài)模型設(shè)計(jì)



模型結(jié)構(gòu)方面,我們基于 Qwen2.5-14B-Instruct,設(shè)計(jì)了一個(gè)時(shí)間序列原生感知的輸入結(jié)構(gòu)。時(shí)間序列被切分為小 patch,并用輕量級(jí) MLP 編碼,嵌入到原始文本上下文中。



與之配套,我們?cè)O(shè)計(jì)了「數(shù)值保值歸一化機(jī)制」??紤]到原始數(shù)值在實(shí)際業(yè)務(wù)中非常重要(如最大 CPU 使用率),我們?cè)趯?duì)序列進(jìn)行 0-1 歸一化時(shí),同時(shí)將歸一化參數(shù)以文本形式保留進(jìn) prompt,使模型既能學(xué)習(xí)序列形態(tài),又不丟失絕對(duì)數(shù)值的意義。

ChatTS 案例展示



我們做了幾個(gè)基于真實(shí)時(shí)間序列的 Case Studies??梢园l(fā)現(xiàn),ChatTS 不僅能對(duì)多變量時(shí)序的形態(tài)進(jìn)行分析,還能輸出時(shí)序中波動(dòng)區(qū)間的位置與幅度。ChatTS 還能夠?qū)](méi)有見(jiàn)過(guò)的時(shí)序波動(dòng)模式進(jìn)行識(shí)別,并基于自己的理解給它「起名字」。

此外,ChatTS 的使用場(chǎng)景非常靈活,無(wú)需精確的 prompt 輸入也能準(zhǔn)確響應(yīng)。例如,我們讓它分析時(shí)序中的所有「事件」,ChatTS 準(zhǔn)確地 get 到了我們的意思,并自動(dòng)提取出時(shí)序中的所有的異常波動(dòng)。此外,ChatTS 還能實(shí)際應(yīng)用結(jié)合,例如結(jié)合專家知識(shí),對(duì)故障去進(jìn)行初步的診斷和分析。

評(píng)估體系



我們一共收集了 3 個(gè)數(shù)據(jù)集用于評(píng)估,包含了 real-world 與合成的時(shí)序數(shù)據(jù),評(píng)測(cè)集覆蓋了對(duì)齊任務(wù)與推理任務(wù)兩大類,共 12 子類的問(wèn)題類型,以全面評(píng)估對(duì)比模型性能。

一、對(duì)齊任務(wù)評(píng)估:全方位精準(zhǔn)識(shí)別時(shí)間序列屬性



我們將 ChatTS 模型與基于 Text、Vision 和 Agent 的模型進(jìn)行對(duì)比。結(jié)果顯示,ChatTS 在所有指標(biāo)上均大幅超越 GPT-4o 及其他基線方法,分類任務(wù) F1 提升 46%–75%,數(shù)值任務(wù)相對(duì)準(zhǔn)確率提升超過(guò) 80%。

在多變量任務(wù)上,ChatTS 優(yōu)勢(shì)更為顯著:ChatTS 能一次性感知多個(gè)變量間的變化趨勢(shì)與關(guān)系,且 token 成本極低,顯示出極強(qiáng)的實(shí)用性與高效性。

二、推理任務(wù)評(píng)估:從歸納到因果,全面提升時(shí)序理解深度



推理任務(wù)包括四類:歸納、演繹、因果、比較。實(shí)驗(yàn)結(jié)果顯示,ChatTS 在所有推理任務(wù)上均優(yōu)于基線,平均提升 25.8%。

思考與展望

ChatTS 展示了一個(gè)全新的范式:通過(guò)可控合成數(shù)據(jù),訓(xùn)練具備真實(shí)理解能力的多模態(tài)大模型。我們從零出發(fā),僅使用合成數(shù)據(jù)訓(xùn)練出了一個(gè)在真實(shí)任務(wù)中表現(xiàn)優(yōu)異的模型,這說(shuō)明「數(shù)據(jù)生成 + 模態(tài)對(duì)齊」的范式具備高度潛力。

當(dāng)前,ChatTS 聚焦在時(shí)序分析的理解與推理任務(wù),未來(lái)我們可以拓展其能力至更高階任務(wù)(例如因果推理、根因分析),甚至結(jié)合外部知識(shí)庫(kù)、專家規(guī)則,實(shí)現(xiàn)更強(qiáng)的決策支持能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
虧得一塌糊涂!20年辛苦收藏:紙幣、郵票、糧票想當(dāng)廢紙全燒了!

虧得一塌糊涂!20年辛苦收藏:紙幣、郵票、糧票想當(dāng)廢紙全燒了!

糖逗在娛樂(lè)
2025-05-20 15:35:03
51歲曹穎自曝患癌,放心不下年幼的兒子,坦言當(dāng)了媽媽后不敢生病

51歲曹穎自曝患癌,放心不下年幼的兒子,坦言當(dāng)了媽媽后不敢生病

叨嘮
2025-05-23 03:40:13
六十歲之后,如果你還有八九十歲的父母,一定要守住這三條規(guī)矩

六十歲之后,如果你還有八九十歲的父母,一定要守住這三條規(guī)矩

二胡的歲月如歌
2025-04-27 18:36:36
德布勞內(nèi)告別派對(duì):瓜帥騎自行車抵達(dá),格拉利什捧場(chǎng)到凌晨

德布勞內(nèi)告別派對(duì):瓜帥騎自行車抵達(dá),格拉利什捧場(chǎng)到凌晨

直播吧
2025-05-22 19:20:08
東南大學(xué)食堂招博士,校方回應(yīng):年薪18萬(wàn),絕對(duì)不存在內(nèi)定

東南大學(xué)食堂招博士,校方回應(yīng):年薪18萬(wàn),絕對(duì)不存在內(nèi)定

揚(yáng)子晚報(bào)
2025-05-22 18:53:48
普京向拉夫羅夫授勛

普京向拉夫羅夫授勛

參考消息
2025-05-22 22:02:02
國(guó)家一級(jí)演員陳麗云,被逮捕

國(guó)家一級(jí)演員陳麗云,被逮捕

觀察者網(wǎng)
2025-05-21 22:24:04
51歲電影演員因病去世:沉默的殺手——結(jié)直腸癌

51歲電影演員因病去世:沉默的殺手——結(jié)直腸癌

馬教授講健康
2025-05-22 09:35:04
浙江寧海,發(fā)生了一起令人不齒的案件!男子史某在KTV叫了陪侍女楊某

浙江寧海,發(fā)生了一起令人不齒的案件!男子史某在KTV叫了陪侍女楊某

叮當(dāng)當(dāng)科技
2025-05-18 14:25:46
深度分析,動(dòng)漫組合爆冷出局的原因,林詩(shī)棟的問(wèn)題最大

深度分析,動(dòng)漫組合爆冷出局的原因,林詩(shī)棟的問(wèn)題最大

老樂(lè)說(shuō)球
2025-05-22 15:23:49
女單8強(qiáng)全部出爐!產(chǎn)生3大不可思議,石洵瑤被淘汰,孫穎莎險(xiǎn)勝!

女單8強(qiáng)全部出爐!產(chǎn)生3大不可思議,石洵瑤被淘汰,孫穎莎險(xiǎn)勝!

云隱南山
2025-05-23 04:51:33
僅剩一人在皇馬!歷史上僅克羅斯、卡瓦哈爾、魔笛和納喬6奪歐冠

僅剩一人在皇馬!歷史上僅克羅斯、卡瓦哈爾、魔笛和納喬6奪歐冠

直播吧
2025-05-22 23:14:17
15點(diǎn)25分!曝山西男籃簽約國(guó)手內(nèi)線,2米11內(nèi)線新星或重返老東家

15點(diǎn)25分!曝山西男籃簽約國(guó)手內(nèi)線,2米11內(nèi)線新星或重返老東家

璞玉話體壇
2025-05-22 20:07:45
突然!青島這5條公交要停運(yùn)

突然!青島這5條公交要停運(yùn)

智慧生活筆記
2025-05-23 00:19:39
就在剛才,世錦賽大喜訊:國(guó)乒王牌3-1逆轉(zhuǎn)、鎖定領(lǐng)獎(jiǎng)臺(tái) 淘汰日本

就在剛才,世錦賽大喜訊:國(guó)乒王牌3-1逆轉(zhuǎn)、鎖定領(lǐng)獎(jiǎng)臺(tái) 淘汰日本

趣文說(shuō)娛
2025-05-22 09:42:03
戛納紅毯上最大的笑話,沒(méi)作品還自導(dǎo)自演一步三回頭,被安保驅(qū)逐

戛納紅毯上最大的笑話,沒(méi)作品還自導(dǎo)自演一步三回頭,被安保驅(qū)逐

紅色鑒史官
2025-05-21 18:40:03
俄導(dǎo)彈擊中烏兵營(yíng)致16人死傷,梅洛尼知錯(cuò)能改歐洲巨頭重歸于好

俄導(dǎo)彈擊中烏兵營(yíng)致16人死傷,梅洛尼知錯(cuò)能改歐洲巨頭重歸于好

史政先鋒
2025-05-22 20:12:46
趙薇曬高清自拍配文意味深長(zhǎng)!臉上一大塊印子很怪異,白發(fā)也明顯

趙薇曬高清自拍配文意味深長(zhǎng)!臉上一大塊印子很怪異,白發(fā)也明顯

史行途
2025-05-21 09:35:34
酸了?32歲孫興慜簇?fù)硐屡醣?萬(wàn)人致敬 霸氣放話:我就是熱刺傳奇

酸了?32歲孫興慜簇?fù)硐屡醣?萬(wàn)人致敬 霸氣放話:我就是熱刺傳奇

我愛(ài)英超
2025-05-22 07:16:40
國(guó)足新一期大名單出爐惹爭(zhēng)議,球迷:劉誠(chéng)宇真是硬拱上去的

國(guó)足新一期大名單出爐惹爭(zhēng)議,球迷:劉誠(chéng)宇真是硬拱上去的

側(cè)身凌空斬
2025-05-22 10:20:13
2025-05-23 06:19:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
10515文章數(shù) 142318關(guān)注度
往期回顧 全部

科技要聞

小米YU7發(fā)布,雷軍:沒(méi)有30萬(wàn)下不來(lái)

頭條要聞

雷軍發(fā)布3nm旗艦芯片 現(xiàn)場(chǎng)安檢空前嚴(yán)格連紙都要寄存

頭條要聞

雷軍發(fā)布3nm旗艦芯片 現(xiàn)場(chǎng)安檢空前嚴(yán)格連紙都要寄存

體育要聞

孫興慜的圓夢(mèng)之夜 曼聯(lián)丟最后遮羞布

娛樂(lè)要聞

朱媛媛喪事一切從簡(jiǎn),親戚剛知她去世

財(cái)經(jīng)要聞

美債、日債都要崩盤(pán)?

汽車要聞

吉利銀河M9登陸米蘭 重新定義AI科技大六座旗艦SUV

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
健康
教育
公開(kāi)課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

房產(chǎn)要聞

狂砸31億!突然,神秘民企重倉(cāng)海南地產(chǎn)!

唇皰疹和口腔潰瘍是"同伙"嗎?

教育要聞

補(bǔ)課補(bǔ)不出腦子,只能補(bǔ)出依賴癥

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 砀山县| 惠东县| 元朗区| 泰和县| 芷江| 石屏县| 怀安县| 乳源| 武威市| 涞源县| 衡南县| 新巴尔虎右旗| 家居| 太仓市| 崇左市| 大邑县| 烟台市| 博兴县| 卢氏县| 洪江市| 得荣县| 香格里拉县| 河曲县| 新丰县| 和顺县| 浮山县| 金昌市| 贵阳市| 仙桃市| 永新县| 桦川县| 鞍山市| 棋牌| 凯里市| 平塘县| 年辖:市辖区| 瓮安县| 乐陵市| 寿阳县| 堆龙德庆县| 四子王旗|