99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

LLM進入「拖拽時代」!只靠Prompt,幾秒定制一個大模型,效率飆升12000倍

0
分享至


新智元報道

編輯:定慧 好困

【新智元導讀】最近,來自NUS、UT Austin等機構的研究人員創(chuàng)新性地提出了一種「拖拽式大語言模型」(DnD),它可以基于提示詞快速生成模型參數,無需微調就能適應任務。不僅效率最高提升12000倍,而且具備出色的零樣本泛化能力。

現在的大模型基本都具備零樣本泛化能力,但要在真實場景中做特定的適配,還是得花好幾個小時來對模型進行微調。

即便是像LoRA這樣的參數高效方法,也只能緩解而不能消除每個任務所需的微調成本。

剛剛,包括尤洋教授在內的來自新加坡國立大學、得克薩斯大學奧斯汀分校等機構的研究人員,提出了一種全新的「拖拽式大語言模型」——Drag-and-Drop LLMs!


論文地址:https://arxiv.org/abs/2506.16406

DnD是一種基于提示詞的參數生成器,能夠對LLM進行無需訓練的自適應微調。

通過一個輕量級文本編碼器與一個級聯(lián)超卷積解碼器的組合,DnD能在數秒內,僅根據無標簽的任務提示詞,生成針對該任務的LoRA權重矩陣。

顯然,對于那些需要快速實現模型專業(yè)化的場景,DnD可以提供一種相較于傳統(tǒng)微調方法更強大、靈活且高效的替代方案。


總結來說,DnD的核心優(yōu)勢如下:

  • 極致效率:其計算開銷比傳統(tǒng)的全量微調低12,000倍。

  • 卓越性能:在零樣本學習的常識推理、數學、編碼及多模態(tài)基準測試中,其性能比最強大的、需要訓練的LoRA模型還要高出30%。

  • 強大泛化:僅需無標簽的提示詞,即可在不同領域間展現出強大的泛化能力。


DnD實現方法

通過觀察,研究人員發(fā)現,LoRA適配器無非是其訓練數據的一個函數:梯度下降會將基礎權重「拖拽」至一個特定任務的最優(yōu)狀態(tài)。

如果能夠直接學習從提示到權重的映射,那么就可以完全繞過梯度下降過程。


DnD通過兩個核心步驟獲得「拖拽」能力:準備訓練數據(左上)與訓練參數生成器(右上)。

  • 在準備數據時,將模型參數(權重)與特定數據集的條件(提示詞)進行顯式配對。

  • 在訓練時,DnD模型將條件作為輸入來生成參數,并使用原始的LoRA參數作為監(jiān)督信號進行學習。

基于這些洞見,團隊提出了「拖拽式大語言模型」,它無需微調即可生成任務專屬的權重。

團隊首先在多個不同數據集上分別訓練并保存相應的LoRA適配器。

為了賦予模型「拖拽」的能力,團隊將這些數據集的提示詞與收集到的LoRA權重進行隨機配對,構成DnD模型的訓練數據——即「提示詞-參數」對。

參數生成器是一個由級聯(lián)卷積塊構成的解碼器。

參數生成器的模塊細節(jié)如下:每個超卷積塊包含三個超卷積模塊,用于在不同維度上提取并融合特征信息。


訓練時,團隊采用一個現成的文本編碼器提取提示詞的嵌入向量,并將其輸入生成器。

生成器會預測出模型權重,團隊利用其與真實LoRA權重之間的均方誤差(MSE)損失來對其進行優(yōu)化。


在推理階段,團隊只需將來自全新數據集(訓練中未見過)的提示詞輸入DnD,僅需一次前向傳播,即可獲得為該任務量身定制的參數。

效果評估

零樣本學習效果



在新的(測試)數據集上的泛化能力。

在所有未曾見過的數據集上,DnD在準確率上都顯著超越了那些用于訓練的LoRA模型。


DnD能為數學、代碼和多模態(tài)問答等更復雜的任務生成參數。

在這些任務上依然展現出強大的零樣本學習能力。



DnD在多種任務上超越了基座LLM,展現出顯著的「拖拽」增強效果。


DnD能夠很好地擴展至更大的7B基座模型,并在更復雜的LiveCodeBench基準測試中保持強勁性能。

通過利用已微調的LoRA作為訓練數據,DnD成功地在輸入提示詞與模型參數之間建立了聯(lián)系。

團隊向DnD輸入其訓練階段從未見過的數據集提示詞,讓它為這些新任務直接生成參數,以此來檢驗其零樣本學習能力。

DnD在權重空間中生成的參數與原始參數分布接近,并且在性能上表現良好。


實驗結果表明,在零樣本測試集上,團隊的方法相較于訓練所用的LoRA模型的平均性能,取得了驚人的提升,并且能夠很好地泛化到多種真實世界任務和不同尺寸的LLM。

對比其他微調方法

為了進一步展示DnD的強大能力,團隊將其與全量樣本微調(full-shot tuning)、少樣本學習(few-shot)以及上下文學習(in-context learning)進行了對比。

令人驚訝的是,DnD的性能超越了LoRA全量微調的效果,同時速度快了2500倍。

雖然經過更多輪次的迭代,全量微調的性能會超過DnD,但其代價是高達12000倍的推理延遲。

此外,在樣本數少于256個時,DnD的性能穩(wěn)定地優(yōu)于少樣本學習和上下文學習。

尤其值得注意的是,少樣本學習和上下文學習都需要依賴帶標簽的答案,而DnD僅僅需要無標簽的提示詞。


DnD能夠達到與全量樣本相當甚至更優(yōu)的性能,同時速度提高了2500-12000倍

作者介紹

Zhiyuan Liang


Zhiyuan Liang目前在新加坡國立大學高性能計算人工智能實驗室實習,師從尤洋教授。同時,也得到了Kai Wang博士和Wangbo Zhao的指導。

此前,他在中國科學技術大學獲得人工智能學士學位。并曾在北卡羅來納大學教堂山分校Huaxiu Yao教授的指導下進行實習,以及在中國科學技術大學數據科學實驗室跟著導師Xiang Wang度過了兩年的時光。

他的研究興趣主要集中在高效機器學習與參數生成,希望從權重空間學習的視角,探索實現更高層次智能的有效路徑。

Zhangyang(Atlas) Wang


Zhangyang Wang目前是德克薩斯大學奧斯汀分校錢德拉家族電氣與計算機工程系的終身副教授,并榮膺坦普爾頓基金會第7號捐贈教席。

他同時也是該校計算機科學系以及奧登研究所計算科學、工程與數學項目的核心教員。

他于2016年獲伊利諾伊大學厄巴納-香檳分校電氣與計算機工程博士學位,師從計算機視覺泰斗黃煦濤(Thomas S.Huang)教授;并于2012年獲中國科學技術大學電子工程與信息科學學士學位。

他的研究興趣主要聚焦于為生成式AI與神經符號AI定堅實的理論與算法基礎。

核心目標是創(chuàng)建結構化、模塊化的模型表示:1)在過參數化模型空間中實現高效、魯棒的學習;2)與符號知識及推理進行無縫連接。

Kai Wang


Kai Wang目前是新加坡國立大學HPC-AI實驗室的研究員,接受尤洋教授的指導。

此前,他在新加坡國立大學獲得數據科學與機器學習博士學位,在中國科學院深圳先進技術研究院獲得計算機技術碩士學位,在北京師范大學珠海校區(qū)獲得學士學位。

他的研究方向聚焦于參數生成與高效機器學習,尤其注重通過探索簡潔的基線方法,來深入洞察深度學習的內在機理。

參考資料:

https://jerryliang24.github.io/DnD/


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
寧靜直播回應與汪峰牽手:不喜歡搖滾的,爆料汪峰常打電話給女友

寧靜直播回應與汪峰牽手:不喜歡搖滾的,爆料汪峰常打電話給女友

聯(lián)友說娛
2025-06-25 16:57:54
Shams警告:今晚都別睡!選秀夜前瘋狂,NBA已發(fā)生四筆地震級交易

Shams警告:今晚都別睡!選秀夜前瘋狂,NBA已發(fā)生四筆地震級交易

球童無忌
2025-06-25 15:42:18
后續(xù)有反轉!2.8萬救護車家屬曬票據喊冤:沒用醫(yī)院設備,沒倒賺

后續(xù)有反轉!2.8萬救護車家屬曬票據喊冤:沒用醫(yī)院設備,沒倒賺

振華觀史
2025-06-24 23:23:12
伊朗將于28日為以伊沖突中遇難的高級指揮官和科學家舉行國葬

伊朗將于28日為以伊沖突中遇難的高級指揮官和科學家舉行國葬

澎湃新聞
2025-06-25 16:36:11
福建一姑娘把“荔枝核”泡水里,兩周長成“粉盆栽”,太治愈了

福建一姑娘把“荔枝核”泡水里,兩周長成“粉盆栽”,太治愈了

美家指南
2025-06-09 11:08:50
毛主席遺體防腐每年花費無數,永久保存的水晶棺,純度高達99.99%

毛主席遺體防腐每年花費無數,永久保存的水晶棺,純度高達99.99%

南權先生
2025-06-24 12:10:24
俄羅斯發(fā)動導彈襲擊

俄羅斯發(fā)動導彈襲擊

魯中晨報
2025-06-25 09:33:02
突發(fā)!S媽出大招反擊,曝汪小菲榨干大S血汗錢,欠大S1.7億未還

突發(fā)!S媽出大招反擊,曝汪小菲榨干大S血汗錢,欠大S1.7億未還

扒星人
2025-06-25 10:19:55
曝湖人已詢價維金斯!美媒模擬3換1方案 為40歲詹皇退役做鋪墊?

曝湖人已詢價維金斯!美媒模擬3換1方案 為40歲詹皇退役做鋪墊?

顏小白的籃球夢
2025-06-25 07:22:01
油價再大跌超6%,大漲超5毛/升的油價,7月1日調整,漲幅大降了

油價再大跌超6%,大漲超5毛/升的油價,7月1日調整,漲幅大降了

油價早知道
2025-06-25 09:54:33
全票FMVP有多難?庫里科比僅1次,詹姆斯、喬丹霸占前二

全票FMVP有多難?庫里科比僅1次,詹姆斯、喬丹霸占前二

大衛(wèi)的籃球故事
2025-06-24 20:40:59
王晶不再隱瞞!曝料17年前“艷照門”內幕,原來陳冠希竟是受害者

王晶不再隱瞞!曝料17年前“艷照門”內幕,原來陳冠希竟是受害者

清游說娛
2025-06-17 09:46:07
剛剛,突發(fā)4.5級地震!多地震感強烈!

剛剛,突發(fā)4.5級地震!多地震感強烈!

天津族
2025-06-25 15:53:57
日本就中國在東海建設新設施提出抗議 外交部回應

日本就中國在東海建設新設施提出抗議 外交部回應

新京報
2025-06-25 15:55:26
張庭試管9次生下的女兒,卻被嘲基因突變,如今15歲,這長相可以嗎?

張庭試管9次生下的女兒,卻被嘲基因突變,如今15歲,這長相可以嗎?

In風尚
2025-06-25 19:27:55
泰山真團結!澤卡破門后全隊集體慶祝,王大雷沖到對手禁區(qū)

泰山真團結!澤卡破門后全隊集體慶祝,王大雷沖到對手禁區(qū)

奧拜爾
2025-06-25 20:13:32
兩部門公告:防止西班牙、意大利癢病傳入我國

兩部門公告:防止西班牙、意大利癢病傳入我國

界面新聞
2025-06-25 18:17:56
鄭爽在美國參加飯局!一直看身邊大佬,發(fā)福染黃發(fā)全程聊天哈哈笑

鄭爽在美國參加飯局!一直看身邊大佬,發(fā)福染黃發(fā)全程聊天哈哈笑

扒星人
2025-06-25 11:22:09
撩人狂魔!蔡依林因演唱會服裝太暴露自嘲,自認出道至今最大尺度

撩人狂魔!蔡依林因演唱會服裝太暴露自嘲,自認出道至今最大尺度

八星人
2025-06-25 15:55:15
“700分也上不了清北”,河南高考特控線535分,700分人數暴漲一倍

“700分也上不了清北”,河南高考特控線535分,700分人數暴漲一倍

妍妍教育日記
2025-06-25 16:24:45
2025-06-25 21:35:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
12950文章數 66078關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

與汪峰節(jié)目牽手引猜測 寧靜談?chuàng)衽紭藴剩核皇俏业牟?/h3>

頭條要聞

與汪峰節(jié)目牽手引猜測 寧靜談?chuàng)衽紭藴剩核皇俏业牟?/h3>

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

向佐接機郭碧婷,全程無交流像陌生人

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

售14.99萬/限量200臺 別克昂科威S新增丹霞紅內飾

態(tài)度原創(chuàng)

藝術
親子
本地
手機
健康

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

終于見面啦!!!!原創(chuàng)dy:@辣炒年糕

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

手機要聞

首銷價 299 元,vivo X Fold5 折疊屏手機行業(yè)首發(fā)單內屏寶

呼吸科專家破解呼吸道九大謠言!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蓬莱市| 济阳县| 青浦区| 西藏| 余江县| 通渭县| 客服| 漾濞| 锦屏县| 武乡县| 沁水县| 山丹县| 敖汉旗| 涞水县| 墨脱县| 泸西县| 韩城市| 自贡市| 远安县| 曲水县| 金阳县| 巨野县| 宁国市| 涞源县| 饶平县| 东海县| 静海县| 都匀市| 突泉县| 陇南市| 丰县| 离岛区| 周宁县| 佛教| 砚山县| 丰城市| 台中县| 郴州市| 上高县| 綦江县| 本溪市|