99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

何愷明改進了謝賽寧的REPA:極大簡化但性能依舊強悍

0
分享至



機器之心報道

編輯:Panda

在建模復雜的數據分布方面,擴散生成模型表現出色,不過它的成果大體上與表征學習(representation learning)領域關聯不大。

通常來說,擴散模型的訓練目標包含一個專注于重構(例如去噪)的回歸項,但缺乏為生成學習到的表征的顯式正則化項。這種圖像生成范式與圖像識別范式差異明顯 —— 過去十年來,圖像識別領域的核心主題和驅動力一直是表征學習。

在表征學習領域,自監督學習常被用于學習適用于各種下游任務的通用表征。在這些方法中,對比學習提供了一個概念簡單但有效的框架,可從樣本對中學習表征。

直觀地講,這些方法會鼓勵相似的樣本對(正例對)之間相互吸引,而相異的樣本對(負例對)之間相互排斥。研究已經證明,通過對比學習進行表征學習,可以有效地解決多種識別任務,包括分類、檢測和分割。然而,還沒有人探索過這些學習范式在生成模型中的有效性。

鑒于表征學習在生成模型中的潛力,謝賽寧團隊提出了表征對齊 (REPA)。該方法可以利用預訓練得到的現成表征模型的能力。在訓練生成模型的同時,該方法會鼓勵其內部表征與外部預訓練表征之間對齊。有關 REPA 的更多介紹可閱讀我們之前的報道《擴散模型訓練方法一直錯了!謝賽寧:Representation matters》。

REPA 這項開創性的成果揭示了表征學習在生成模型中的重要性;然而,它的已有實例依賴于額外的預訓練、額外的模型參數以及對外部數據的訪問。

簡而言之,REPA 比較麻煩,要真正讓基于表征的生成模型實用,必需一種獨立且極簡的方法。

這一次,MIT 本科生 Runqian Wang 與超 70 萬引用的何愷明出手了。他們共同提出了Dispersive Loss,可譯為「分散損失」。這是一種靈活且通用的即插即用正則化器,可將自監督學習集成到基于擴散的生成模型中。



  • 論文標題:Diffuse and Disperse: Image Generation with Representation Regularization
  • 論文鏈接:https://arxiv.org/abs/2506.09027v1

分散損失的核心思想其實很簡單:除了模型輸出的標準回歸損失之外,再引入了一個用于正則化模型的內部表征的目標(圖 1)。



直覺上看,分散損失會鼓勵內部表征在隱藏空間中散開,類似于對比學習中的排斥效應。同時,原始的回歸損失(去噪)則自然地充當了對齊機制,從而無需像對比學習那樣手動定義正例對。

一言以蔽之:分散損失的行為類似于「沒有正例對的對比損失」

因此,與對比學習不同,它既不需要雙視圖采樣、專門的數據增強,也不需要額外的編碼器。訓練流程完全可以遵循基于擴散的模型(及基于流的對應模型)中使用的標準做法,唯一的區別在于增加了一個開銷可忽略不計的正則化損失。

與 REPA 機制相比,這種新方法無需預訓練、無需額外的模型參數,也無需外部數據。憑借其獨立且極簡的設計,該方法清晰地證明:表征學習無需依賴外部信息源也可助益生成式建模。

帶點數學的方法詳解

分散損失

新方法的核心是通過鼓勵生成模型的內部表征在隱藏空間中的分散來對其進行正則化。這里,將基于擴散的模型中的原始回歸損失稱為擴散損失(diffusion loss),將新引入的正則化項稱為分散損失(Dispersive Loss)

如果令 X = {x_i} 為有噪聲圖像 x_i 構成的一批數據,則該數據批次的目標函數為:







等式 (6) 中定義的基于 InfoNCE 的分散損失類似于前述先前關于自監督學習的論文中的均勻性損失(盡管這里沒有對表示進行 ?? 正則化)。在那篇論文中的對比表示學習,均勻性損失被應用于輸出表示,并且必須與對齊損失(即正則項)配對。而這里的新公式則更進一步,移除了中間表示上的對齊項,從而僅關注正則化視角。

該團隊注意到,當 j = i 時,就不需要明確排除項 D (z_i,z_j)。由于不會在一個批次中使用同一圖像的多個視圖,因此該項始終對應于一個恒定且最小的差異度,例如在?? 的情況下為 0,在余弦情況下為 -1。因此,當批次大小足夠大時,這個項在那個對數中的作用是充當一個常數偏差,其貢獻會變小。在實踐中,無需排除該項,這也簡化了實現。

分散損失的其他變體

分散損失的概念可以自然延伸到 InfoNCE 之外的一類對比損失函數。

任何鼓勵排斥負例的目標都可以被視為分散目標,并實例化為分散損失的一種變體。基于其他類型的對比損失函數,該團隊構建了另外兩種變體。表 1 總結了所有三種變體,并比較了對比損失函數和分散損失函數。



鉸鏈損失(Hinge Loss)



使用分散損失的擴散模型

如表 1 所示,所有分散損失的變體都比其對應的分散損失更簡潔。更重要的是,所有分散損失函數都適用于單視圖批次,這樣就無需進行多視圖數據增強。因此,分散損失可以在現有的生成模型中充當即插即用的正則化器,而無需修改回歸損失的實現

在實踐中,引入分散損失只需進行少量調整:

  1. 指定應用正則化器的中間層;
  2. 計算該層的分散損失并將其添加到原始擴散損失中。

算法 2 給出了訓練偽代碼,其中包含算法 1 中定義的分散損失的具體形式。



該團隊表示:「我們相信,這種簡化可極大地促進我們方法的實際應用,使其能夠應用于各種生成模型。」

分散損失的實際表現如何?

表 2 比較了分散損失的不同變體及相應的對比損失。



可以看到,在使用獨立噪聲時,對比損失在所有研究案例中均未能提高生成質量。該團隊猜想對齊兩個噪聲水平差異很大的視圖會損害學習效果。

而分散損失的表現總是比相應的對比損失好,而前者還避免了雙視圖采樣帶來的復雜性。



另外,該團隊還研究了不同模塊選擇以及不同 λ(控制正則化強度)和 τ(InfoNCE 中的溫度)值的影響。詳見原論文。

另外,不管是在 DiT(Diffusion Transformer)還是 SiT(Scalable Interpolant Transformers)上,分散損失在所有場景下都比基線方法更好。有趣的是,他們還觀察到,當基線性能更強時,相對改進甚至絕對改進往往還會更大。



總體而言,這種趨勢有力地證明了分散損失的主要作用在于正則化。由于規模更大、性能更強的模型更容易過擬合,因此有效的正則化往往會使它們受益更多。

圖 5 展示了 SiT-XL/2 模型生成的一些示例圖像。



當然,該團隊也將新方法與 REPA 進行了比較。新方法的正則化器直接作用于模型的內部表示,而 REPA 會將其與外部模型的表示對齊。因此,為了公平起見,應同時考慮額外的計算開銷和外部信息源,如表 6 所示。



REPA 依賴于一個預訓練的 DINOv2 模型,該模型本身是從已在 1.42 億張精選圖像上訓練過的 11B 參數主干網絡中蒸餾出來的。

相比之下,新提出的方法完全不需要這些:無需預訓練、外部數據和額外的模型參數。新方法在將訓練擴展到更大的模型和數據集時非常適用,并且該團隊預計在這種情況下正則化效果會非常好。

最后,新提出的方法可以直接泛化用于基于一步式擴散的生成模型。



在表 7(左)中,該團隊將分散損失應用于最新的 MeanFlow 模型,然后觀察到了穩定持續的改進。表 7(右)將這些結果與最新的一步擴散 / 基于流的模型進行了比較,表明新方法可增強 MeanFlow 的性能并達到了新的 SOTA。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
不許改變南海現狀,G7再度對華叫板,話音剛落,中方直接定下規矩

不許改變南海現狀,G7再度對華叫板,話音剛落,中方直接定下規矩

妙知
2025-06-20 10:31:09
發現了沒有,51歲的劉強東,中老年男人的特質他是一個也沒有啊!

發現了沒有,51歲的劉強東,中老年男人的特質他是一個也沒有啊!

東方不敗然多多
2025-06-19 11:05:21
侯森:點球大戰獲有運氣成分,國安遠征軍氣勢不輸大連主場

侯森:點球大戰獲有運氣成分,國安遠征軍氣勢不輸大連主場

雷速體育
2025-06-21 22:28:36
從7月起,需做好“潮水退去”后的準備?房地產或將出現5個趨勢

從7月起,需做好“潮水退去”后的準備?房地產或將出現5個趨勢

平說財經
2025-06-21 07:14:09
足協杯!2-1,奧斯卡、恩里克驚艷破門:率云南玉昆晉級八強

足協杯!2-1,奧斯卡、恩里克驚艷破門:率云南玉昆晉級八強

側身凌空斬
2025-06-21 20:56:31
女排3-1日本!攔網無解,龔翔宇+2主攻+2副攻齊爆,張籽萱成長!

女排3-1日本!攔網無解,龔翔宇+2主攻+2副攻齊爆,張籽萱成長!

籃球資訊達人
2025-06-21 21:54:54
阿斯麥CEO哀嘆:沒用的,無論給中國設置多少障礙,都沒用

阿斯麥CEO哀嘆:沒用的,無論給中國設置多少障礙,都沒用

混沌錄
2025-06-21 23:14:06
鄭秀文香奈兒造型炸場,時尚表現力滿分

鄭秀文香奈兒造型炸場,時尚表現力滿分

述家娛記
2025-06-20 22:20:27
福建省委常委、組織部部長苗延紅,添新職

福建省委常委、組織部部長苗延紅,添新職

中國日報網
2025-06-21 15:22:05
莫言:喜歡把家里打掃得很干凈的人,表面整潔,實則暴露了人生真相......

莫言:喜歡把家里打掃得很干凈的人,表面整潔,實則暴露了人生真相......

不二大叔
2025-06-19 21:44:53
女子出軌被抓包,丈夫抓她游行示眾:她把我的錢給其他男人花

女子出軌被抓包,丈夫抓她游行示眾:她把我的錢給其他男人花

唐小糖說情感
2025-06-15 08:46:47
打完加沙打伊朗,以色列下一個目標是誰?還是一個亞洲國家

打完加沙打伊朗,以色列下一個目標是誰?還是一個亞洲國家

安珈使者啊
2025-06-21 22:45:03
1.05億,再見火箭!斯通給的還是太多,休城這回是真砸手里了

1.05億,再見火箭!斯通給的還是太多,休城這回是真砸手里了

呆哥聊球
2025-06-21 20:13:12
揭秘國內著名風水斗法事件!貧窮不僅僅限制了你的想象力!

揭秘國內著名風水斗法事件!貧窮不僅僅限制了你的想象力!

談史論天地
2025-06-20 07:50:03
多國出現了退貨潮!演習失敗,中國蘇-35反而成了爆款?

多國出現了退貨潮!演習失敗,中國蘇-35反而成了爆款?

科技處長
2025-06-10 23:00:13
張智霖獨自駕豪車買水被偶遇,54歲生圖曝光:這狀態確定沒開美顏

張智霖獨自駕豪車買水被偶遇,54歲生圖曝光:這狀態確定沒開美顏

玫瑰講娛
2025-06-21 08:13:57
“嫂子,咱媽病了,需要5萬做手術”嫂子:你媽病了,關我什么事

“嫂子,咱媽病了,需要5萬做手術”嫂子:你媽病了,關我什么事

多久情感
2025-06-20 21:51:01
血型可以預測癌癥?研究發現:A、AB血型的人,患癌風險更高

血型可以預測癌癥?研究發現:A、AB血型的人,患癌風險更高

素衣讀史
2025-06-18 10:43:20
阿根廷的“瘋子”總統,扇了誰的耳光?

阿根廷的“瘋子”總統,扇了誰的耳光?

古老板的老巢
2025-06-18 00:39:39
哈梅內伊與家人一起躲入地堡,內景曝光!已將權力委托革命衛隊

哈梅內伊與家人一起躲入地堡,內景曝光!已將權力委托革命衛隊

環球熱點快評
2025-06-19 10:21:28
2025-06-22 00:20:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10687文章數 142343關注度
往期回顧 全部

科技要聞

Siri有救了?蘋果被曝正討論史上最大收購

頭條要聞

官方通報那爾那茜有關情況:涉嫌高考報名材料造假

頭條要聞

官方通報那爾那茜有關情況:涉嫌高考報名材料造假

體育要聞

王欣瑜:資格賽差點要退賽 夢幻般的一周

娛樂要聞

離婚7年,楊冪逆襲碾壓劉愷威

財經要聞

租金大撤退!房東正在批量跑路!

汽車要聞

扔掉"舊地圖”一汽-大眾大眾品牌要找"新大陸"

態度原創

藝術
健康
教育
手機
數碼

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言!

教育要聞

2025北京高招變數大!這些志愿填報的坑,千萬別踩!

手機要聞

曝REDMI K90系列影像新升級:評估豪威OV50Q主攝

數碼要聞

電視“鴻蒙”時刻?疑似搭載旗艦手機芯片,革新百年電視產業!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 盘锦市| 东山县| 射阳县| 吉首市| 西华县| 福州市| 常山县| 新津县| 洛扎县| 偃师市| 手机| 南安市| 高平市| 江西省| 安远县| 武宣县| 甘洛县| 岱山县| 揭东县| 十堰市| 怀宁县| 子长县| 登封市| 阿克苏市| 隆尧县| 洪洞县| 碌曲县| 英超| 荥经县| 桂林市| 河池市| 茂名市| 随州市| 平度市| 铁岭县| 凯里市| 襄城县| 宜兴市| 买车| 昌邑市| 镇宁|