99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一句話生成任務(wù)專屬LoRA!Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)

0
分享至

鷺羽 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

告別繁瑣微調(diào),一句話就能生成LoRA?!

由Transformer作者之一Llion Jones聯(lián)合創(chuàng)立的明星AI公司SakanaAI,近期推出Text-to-LoRA(T2L),徹底簡(jiǎn)化了模型適配流程:



現(xiàn)在,微調(diào)大模型時(shí)動(dòng)輒數(shù)周的數(shù)據(jù)集準(zhǔn)備、反復(fù)調(diào)整超參數(shù)的復(fù)雜流程,可以省了。



使用T2L生成的LoRA在參數(shù)壓縮率上可達(dá)80%卻僅降1.2%準(zhǔn)確率,零樣本場(chǎng)景下更以78.3%的平均準(zhǔn)確率超越現(xiàn)有SOTA方法。

可以說(shuō),“一句話定制模型”的時(shí)代正在開(kāi)啟,非技術(shù)用戶不再需要學(xué)習(xí)復(fù)雜的微調(diào)知識(shí),直接用通俗易懂的自然語(yǔ)言就可以完成相應(yīng)工作。



有網(wǎng)友甚至把它比喻為L(zhǎng)LM的一個(gè)只有文字描述的私人教練,將會(huì)徹底改變游戲規(guī)則。



目前該論文已被ICML2025收錄。



詳細(xì)內(nèi)容如下:

從文本到LoRA

LLM在執(zhí)行特定任務(wù)前,都需要先進(jìn)行適配的LoRA微調(diào),為每個(gè)任務(wù)單獨(dú)訓(xùn)練低秩矩陣,往往耗費(fèi)大量計(jì)算資源和時(shí)間。

研究團(tuán)隊(duì)從人類視覺(jué)系統(tǒng)中汲取靈感,即在有限的感官線索下可以實(shí)現(xiàn)環(huán)境快速適應(yīng),并由此構(gòu)建了能夠動(dòng)態(tài)調(diào)制大模型的超網(wǎng)絡(luò)架構(gòu)Text-to-LoRA(T2L)



T2L包含3種架構(gòu)變體,它們?cè)谳敵隹臻g和參數(shù)規(guī)模上各有不同,具體為:

  • T2L-L:

為每個(gè)目標(biāo)模塊(如注意力層、MLP 層)和網(wǎng)絡(luò)層生成完整的 LoRA 權(quán)重矩陣。

該架構(gòu)的參數(shù)規(guī)模最大,但能靈活適配不同層的特性,適用于需要精細(xì)控制每層適配的場(chǎng)景。

  • T2L-M:

按模塊類型(而非具體層)共享輸出空間。對(duì)于同一類型的模塊,超網(wǎng)絡(luò)僅生成一組共享的LoRA矩陣,并應(yīng)用于該類型下的所有層。

該架構(gòu)通過(guò)參數(shù)共享減少了模型規(guī)模,同時(shí)保留了模塊類型級(jí)別的適配能力,在參數(shù)效率和性能之間取得平衡。

  • T2L-S:

為整個(gè)模型生成統(tǒng)一的LoRA適配器,不區(qū)分模塊類型和層索引。

該架構(gòu)參數(shù)規(guī)模最小,適用于計(jì)算資源有限或任務(wù)需求較通用的場(chǎng)景,通過(guò)全局適配實(shí)現(xiàn)快速部署。



為了訓(xùn)練T2L模型,可以采用兩種訓(xùn)練模式,分別是基于LoRA的重建和跨多個(gè)任務(wù)的監(jiān)督微調(diào)(SFT)

LoRA重建的核心思想是讓T2L從任務(wù)的文本描述中,生成與真實(shí)LoRA適配器效果相近的參數(shù),從而最大限度地減少生成適配器和目標(biāo)適配器之間的重建損失。

這種方法避免了傳統(tǒng)方法中對(duì)大量任務(wù)數(shù)據(jù)的依賴,轉(zhuǎn)而利用已有的LoRA適配器和文本描述構(gòu)建監(jiān)督信號(hào),壓縮了現(xiàn)有的LoRAs,但難以進(jìn)行零鏡頭泛化。

監(jiān)督微調(diào)則是使用任務(wù)描述,在任務(wù)數(shù)據(jù)集上直接端到端訓(xùn)練T2L。這改進(jìn)了對(duì)未知任務(wù)的泛化,并能夠根據(jù)文本描述生成具有可引導(dǎo)行為的適配器。



針對(duì)T2L的適配器壓縮性能,團(tuán)隊(duì)進(jìn)行了實(shí)驗(yàn)驗(yàn)證。

通過(guò)設(shè)置9個(gè)不同的NLP任務(wù),將一一對(duì)應(yīng)的LoRA適配器參數(shù)壓縮為文本描述的嵌入向量,并通過(guò)3種T2L變體分別重建LoRA參數(shù)。

實(shí)驗(yàn)發(fā)現(xiàn),重建LoRA與原始LoRA相比,參數(shù)規(guī)模從15.8M下降為3.2M,壓縮率達(dá)80%,但在任務(wù)的平均準(zhǔn)確率上僅下降了1.2%,證明了壓縮過(guò)程中的知識(shí)保留能力。

其中,T2L-L在壓縮后性能最接近原始LoRA,而T2L-S壓縮率最高。

T2L能夠?qū)崿F(xiàn)高效的參數(shù)壓縮,可以極大地減少存儲(chǔ)需求,幫助LLM在資源受限環(huán)境中進(jìn)行部署。



團(tuán)隊(duì)還進(jìn)一步驗(yàn)證了T2L在零樣本場(chǎng)景下生成LoRA適配器的能力。

構(gòu)建了12個(gè)全新的NLP任務(wù)并各自提供自然語(yǔ)言描述,使用T2L生成的對(duì)應(yīng)LoRA適配器直接應(yīng)用于基礎(chǔ)模型,測(cè)試其在標(biāo)注數(shù)據(jù)集上的性能。

結(jié)果表明,T2L的平均準(zhǔn)確率達(dá)到了78.3%,顯著高于多任務(wù)LoRA的65.1%,和目前最先進(jìn)的零樣本LoRA路由方法Arrow Routing的72.4%。

其中T2L-L因?yàn)槟軌驗(yàn)椴煌瑢佣ㄖ茀?shù),在復(fù)雜任務(wù)中表現(xiàn)最佳,而T2L-S在簡(jiǎn)單任務(wù)上效率更高,參數(shù)規(guī)模僅為T(mén)2L-L的五分之一,但性能僅下降3.2%

源于超網(wǎng)絡(luò)對(duì) “文本語(yǔ)義 - 參數(shù)空間” 映射的顯式學(xué)習(xí),T2L實(shí)現(xiàn)了真正的文本驅(qū)動(dòng),無(wú)需任務(wù)數(shù)據(jù)即可通過(guò)自然語(yǔ)言描述生成有效LoRA,這為模型快速適應(yīng)長(zhǎng)尾任務(wù)提供了可能。

Transformer作者創(chuàng)業(yè)公司

背后的公司Sakana AI,由前谷歌研究人員Llion Jones于2023年7月共同創(chuàng)立。

Llion Jones是著名論文《Attention Is All You Need》的8位核心作者之一,論文中首次提出了Transformer架構(gòu),為現(xiàn)代LLM架構(gòu)奠定了基石。



在谷歌工作期間,他還深度參與NLP、模型架構(gòu)創(chuàng)新等眾多核心AI項(xiàng)目,例如Prot Trans、Tensor2Tensor等。

而創(chuàng)辦Sakana AI后,他也始終致力于探索超越和補(bǔ)充當(dāng)前Transformer范式的新路徑,例如他們?cè)谌ツ甑淄瞥隽擞糜赥ransformer的新型神經(jīng)記憶系統(tǒng)NAMM,今年1月提出的Transformer2可以針對(duì)各種任務(wù)動(dòng)態(tài)調(diào)整權(quán)重。



目前公司專注利用自然啟發(fā)的方法(如進(jìn)化計(jì)算和集體智能)來(lái)開(kāi)發(fā)基礎(chǔ)模型,例如在今年5月他們根據(jù)達(dá)爾文進(jìn)化論提出了達(dá)爾文哥德?tīng)枡C(jī)(DGM),可以讓AI通過(guò)讀取和修改自身代碼來(lái)提升編碼性能。



而本篇論文則由Rujikorn Charakorn、Edoardo Cetin、Yujin Tang、Robert T. Lange共同完成。



Rujikorn Charakorn曾在朱拉隆功大學(xué)就讀,目前在VISTEC研究所攻讀博士學(xué)位,主要研究方向是深度強(qiáng)化學(xué)習(xí)、多智能體學(xué)習(xí)和元學(xué)習(xí)。

Edoardo Cetin于2023年獲得倫敦國(guó)王學(xué)院的博士學(xué)位,目前是Sakana AI的研究科學(xué)家,此前還曾在推特的Cortex團(tuán)隊(duì)、豐田和高盛實(shí)習(xí)。

而Yujin Tang則博士畢業(yè)于東京大學(xué),曾在谷歌工作長(zhǎng)達(dá)5年,后來(lái)于2024年加入Sakana AI。



Robert T. Lange是Sakana AI的研究科學(xué)家和創(chuàng)始成員之一,致力于用基礎(chǔ)模型來(lái)增強(qiáng)和自動(dòng)化科學(xué)發(fā)現(xiàn)過(guò)程。

他還主導(dǎo)參與了首個(gè)獨(dú)立生成學(xué)術(shù)論文的“AI科學(xué)家”項(xiàng)目,還曾在社區(qū)引起廣泛熱議。

論文鏈接:https://arxiv.org/abs/2506.06105
代碼鏈接:https://github.com/SakanaAI/Text-to-Lora

參考鏈接:
[1]https://x.com/RobertTLange/status/1933074366603919638
[2]https://huggingface.co/SakanaAI/text-to-lora/tree/main
[3]https://x.com/tan51616/status/1932987022907670591
[4]https://x.com/SakanaAILabs/status/1932972420522230214

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
明示姆巴佩!皇馬新帥強(qiáng)勢(shì)發(fā)聲!拒絕通融,考慮變陣,沖歐冠三連

明示姆巴佩!皇馬新帥強(qiáng)勢(shì)發(fā)聲!拒絕通融,考慮變陣,沖歐冠三連

阿泰希特
2025-06-16 15:06:41
印度國(guó)會(huì)對(duì)印政府跳過(guò)上合組織發(fā)表聲明表示譴責(zé)。

印度國(guó)會(huì)對(duì)印政府跳過(guò)上合組織發(fā)表聲明表示譴責(zé)。

老友科普
2025-06-16 07:07:35
世俱杯揭幕戰(zhàn)球場(chǎng)食品飲料價(jià)格昂貴,一罐啤酒約人民幣100元

世俱杯揭幕戰(zhàn)球場(chǎng)食品飲料價(jià)格昂貴,一罐啤酒約人民幣100元

懂球帝
2025-06-16 10:39:11
太瘋狂!泡泡瑪特一新店,開(kāi)業(yè)2小時(shí)賣光閉店!原來(lái)LABUBU已經(jīng)10歲了→

太瘋狂!泡泡瑪特一新店,開(kāi)業(yè)2小時(shí)賣光閉店!原來(lái)LABUBU已經(jīng)10歲了→

金融界
2025-06-16 13:19:41
以伊連續(xù)第4天互轟:高官被斬,平民罹難,牽動(dòng)全球

以伊連續(xù)第4天互轟:高官被斬,平民罹難,牽動(dòng)全球

上觀新聞
2025-06-16 21:01:12
收手吧!“資本家的丑孩子”,長(zhǎng)的不行演技還爛,妥妥一個(gè)戲混子

收手吧!“資本家的丑孩子”,長(zhǎng)的不行演技還爛,妥妥一個(gè)戲混子

頭號(hào)劇委會(huì)
2025-06-14 12:00:47
廣東一茶廠,因風(fēng)光太美被迫營(yíng)業(yè),一年接待游客幾十萬(wàn)

廣東一茶廠,因風(fēng)光太美被迫營(yíng)業(yè),一年接待游客幾十萬(wàn)

開(kāi)心菜菜愛(ài)旅行
2025-06-15 20:18:46
太震撼了!這個(gè)夏天的演唱會(huì)有多瘋狂?全國(guó)初步統(tǒng)計(jì),一天40多場(chǎng)

太震撼了!這個(gè)夏天的演唱會(huì)有多瘋狂?全國(guó)初步統(tǒng)計(jì),一天40多場(chǎng)

火山詩(shī)話
2025-06-15 13:38:08
海南通報(bào):市長(zhǎng)、副市長(zhǎng)、縣長(zhǎng)等148人,被嚴(yán)肅追責(zé)問(wèn)責(zé)!

海南通報(bào):市長(zhǎng)、副市長(zhǎng)、縣長(zhǎng)等148人,被嚴(yán)肅追責(zé)問(wèn)責(zé)!

新京報(bào)
2025-06-15 21:42:02
伊朗20%導(dǎo)彈突防,意外曝光中國(guó)降維打擊實(shí)力,震撼西方

伊朗20%導(dǎo)彈突防,意外曝光中國(guó)降維打擊實(shí)力,震撼西方

阿芒娛樂(lè)說(shuō)
2025-06-16 22:30:17
《天道》:不管參加什么飯局,提前走不要特意和高層領(lǐng)導(dǎo)一一道別

《天道》:不管參加什么飯局,提前走不要特意和高層領(lǐng)導(dǎo)一一道別

筆墨之林
2025-04-21 11:21:05
方媛深夜曬照祝郭富城父親節(jié)快樂(lè),一個(gè)細(xì)節(jié)疑暴露三胎孩子性別

方媛深夜曬照祝郭富城父親節(jié)快樂(lè),一個(gè)細(xì)節(jié)疑暴露三胎孩子性別

界史
2025-06-16 10:47:52
CBA勁旅損失慘重!19歲小將遭遇嚴(yán)重骨折,他曾單場(chǎng)砍下40+

CBA勁旅損失慘重!19歲小將遭遇嚴(yán)重骨折,他曾單場(chǎng)砍下40+

籃球?qū)^(qū)
2025-06-16 16:32:51
女子出軌被抓包,丈夫抓她游行示眾:她把我的錢(qián)給其他男人花

女子出軌被抓包,丈夫抓她游行示眾:她把我的錢(qián)給其他男人花

唐小糖說(shuō)情感
2025-06-15 08:46:47
快訊!外媒:伊朗總統(tǒng)稱無(wú)意發(fā)展核武器,但堅(jiān)持追求核能與核研究的權(quán)利

快訊!外媒:伊朗總統(tǒng)稱無(wú)意發(fā)展核武器,但堅(jiān)持追求核能與核研究的權(quán)利

環(huán)球網(wǎng)資訊
2025-06-16 14:07:45
媒體人談和平杯:日本烏茲別克韓國(guó)都是亞洲頂流,很有鍛煉價(jià)值

媒體人談和平杯:日本烏茲別克韓國(guó)都是亞洲頂流,很有鍛煉價(jià)值

直播吧
2025-06-16 17:20:16
典型案例 | 陜西省榆林市水土流失治理存在差距

典型案例 | 陜西省榆林市水土流失治理存在差距

生態(tài)環(huán)境部
2025-06-16 10:15:49
打不過(guò)就加入?印度網(wǎng)紅模仿豪哥哥穿唐裝、用咖喱味中文嘲諷國(guó)足

打不過(guò)就加入?印度網(wǎng)紅模仿豪哥哥穿唐裝、用咖喱味中文嘲諷國(guó)足

史書(shū)無(wú)明
2025-06-14 15:53:27
飛機(jī)偶遇58歲鄭伊健,面部變化很大,嘴巴有些奇怪,看著有些憔悴

飛機(jī)偶遇58歲鄭伊健,面部變化很大,嘴巴有些奇怪,看著有些憔悴

熱點(diǎn)網(wǎng)友
2025-06-15 21:16:02
汪小菲搞笑曬父親節(jié)禮物,兒子女兒各送一幅畫(huà),一家四口互動(dòng)溫馨

汪小菲搞笑曬父親節(jié)禮物,兒子女兒各送一幅畫(huà),一家四口互動(dòng)溫馨

鋭娛之樂(lè)
2025-06-15 08:54:23
2025-06-17 00:19:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10676文章數(shù) 176167關(guān)注度
往期回顧 全部

科技要聞

雷軍:?戒O1芯片還要再做5年、10年

頭條要聞

美突然大規(guī)模向中東調(diào)兵 媒體:美國(guó)實(shí)際上已部分參戰(zhàn)

頭條要聞

美突然大規(guī)模向中東調(diào)兵 媒體:美國(guó)實(shí)際上已部分參戰(zhàn)

體育要聞

被偷走的世界杯資格 他們用20年搶回來(lái)了

娛樂(lè)要聞

該管管了!楊坤篡改革命紅歌遭痛批

財(cái)經(jīng)要聞

618國(guó)補(bǔ)貼錢(qián)反漲價(jià) 美的深陷價(jià)格魔術(shù)漩渦

汽車要聞

榮威M7 DMH外觀官圖發(fā)布 預(yù)計(jì)將于下半年正式上市

態(tài)度原創(chuàng)

旅游
房產(chǎn)
健康
教育
軍事航空

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

房產(chǎn)要聞

又一城購(gòu)房補(bǔ)貼!買(mǎi)房就發(fā)錢(qián),正在海南樓市瘋狂擴(kuò)散!

呼吸科專家破解呼吸道九大謠言!

教育要聞

哪些項(xiàng)目是成都中考藝體特長(zhǎng)的“招生大戶”?我們用數(shù)據(jù)告訴你

軍事要聞

俄羅斯暫停駐伊朗領(lǐng)事工作 宣布從伊朗撤僑

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 博罗县| 长葛市| 武宣县| 连平县| 宁化县| 姚安县| 阿城市| 兴安县| 玛多县| 繁昌县| 年辖:市辖区| 梓潼县| 镇巴县| 古交市| 宁波市| 揭西县| 天柱县| 南投县| 丰镇市| 南通市| 峡江县| 钟祥市| 保靖县| 正安县| 贞丰县| 横山县| 洪雅县| 息烽县| 剑阁县| 新蔡县| 确山县| 常州市| 山东| 朝阳区| 天气| 积石山| 宁河县| 略阳县| 孝昌县| 苏尼特右旗| 东辽县|