99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

南洋理工&普渡大學提出CFG-Zero?:在Flow Matching模型中實現更穩健的無分類器引導方法

0
分享至

隨著生成式AI的發展,文本生成圖像與視頻的擴散模型(Diffusion Models)成為計算機視覺的研究熱點。近年來,Flow Matching以更強的可解釋性和更快的收斂速度,逐漸替代基于SDE的傳統擴散方法,成為主流模型(如

Lumina-Next、Stable Diffusion 3/3.5、Wan2.1)的核心方案。

但在生成過程中,如何更有效地引導模型輸出仍是難點。當前主流的Classifier-Free Guidance(CFG)雖被廣泛使用,但在訓練不足或估計誤差較大時,容易引發偏差、偽影或結構坍塌。

為此,南洋理工大學S-Lab與普渡大學提出CFG-Zero?,從理論上分析了CFG在Flow Matching框架下的結構性誤差,并設計了兩項輕量級改進方案,顯著提升了生成質量、文本對齊性與穩定性。


論文標題: CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models 論文鏈接: https://arxiv.org/abs/2503.18886 代碼鏈接: https://github.com/WeichenFan/CFG-Zero-star 項目主頁: https://weichenfan.github.io/webpage-cfg-zero-star/

隨著生成式AI的快速發展,文本生成圖像與視頻的擴散模型(Diffusion Models)已成為計算機視覺領域的研究與應用熱點。近年來,Flow Matching作為一種更具可解釋性、收斂速度更快的生成范式,正在逐步取代傳統的基于隨機微分方程(SDE)的擴散方法,成為主流模型(如Lumina-Next、Stable Diffusion 3/3.5、Wan2.1等)中的核心方案。

然而,在這一技術迭代過程中,一個關鍵問題依然存在:如何在推理階段更好地引導生成過程,使模型輸出更加符合用戶提供的文本描述。Classifier-Free Guidance(CFG)是當前廣泛采用的引導策略,但其引導路徑在模型尚未充分訓練或估計誤差較大時,容易導致樣本偏離真實分布,甚至引入不必要的偽影或結構崩塌。

對此,南洋理工大學S-Lab與普渡大學的研究者聯合提出了創新方法——CFG-Zero?,針對傳統CFG在Flow Matching框架下的結構性誤差進行了理論分析,并設計了兩項輕量級但效果顯著的改進機制,使生成圖像/視頻在細節保真度、文本對齊性與穩定性上全面提升。


一、研究動機:CFG為何失效?

傳統的CFG策略通過對有條件與無條件預測結果進行插值來實現引導。然而在Flow Matching模型中,推理過程是通過解常微分方程(ODE)進行的,其每一步依賴于前一步的速度估計。當模型訓練不足時,初始階段的速度往往較為不準確,而CFG此時的引導反而會將樣本推向錯誤軌跡。研究者在高斯混合分布的可控實驗中發現,CFG在初始步的引導效果甚至不如“靜止不動”,即設速度為0。

二、方法介紹

研究者提出了CFG-Zero?,并引入以下兩項關鍵創新:


  1. 優化縮放因子(Optimized Scale):在每個時間步中動態計算有條件速度與無條件速度的內積比值,從而調整CFG中無條件項的強度,避免“過度引導”導致的誤差。

  2. 零初始化(Zero-init):將ODE求解器的前K步速度置為零(默認K=1),跳過模型最不可靠的預測階段,有效降低初始誤差傳播。

這兩項策略可無縫集成至現有的CFG推理流程中,幾乎不引入額外計算開銷。下面我們具體介紹該方法的細節:

1. 優化縮放因子:

首先CFG的目標是能夠估計出一個修正的速度,能夠盡可能的接近真實速度:


為了提升引導的精度,研究者引入了一個修正因子s:


基于此可以建立優化的目標:

代入化簡可以得到:


求解最優值為:

因此新的CFG形式為:

2. 零初始化:

研究者在2D多元高斯分布上進行進一步定量分析,可以求解得到擴散過程中每一步的最優速度的closed-form:


基于此他們在訓練了一個模型,并分析訓練不同輪數下模型的誤差,如下圖所示。


研究者發現在訓練早期階段,無分類引導得到的速度誤差較大,甚至不如將速度設置為0:


他們進一步在高緯情況下驗證了這一觀察,如下圖所示。


研究者對比原始CFG,與僅使用零初始化的CFG,發現隨著模型的收斂,零初始化的收益逐漸變小,在160輪訓練后出現拐點,與多元高斯實驗結果吻合。

三、實驗結果

研究者在多個任務與主流模型上驗證了CFG-Zero?的有效性,涵蓋了文本生成圖像(Text-to-Image)與文本生成視頻(Text-to-Video)兩大方向。在圖像生成任務中,研究團隊選用了Lumina-Next、SD3、SD3.5、Flux等當前SOTA模型進行對比實驗,結果顯示CFG-Zero?在Aesthetic Score與CLIP Score兩項核心指標上均優于原始CFG。

例如在Stable Diffusion 3.5上,美學分有明顯提高,不僅圖像美感更強,而且語義一致性更好。在T2I-CompBench評測中,CFG-Zero?在色彩、紋理、形狀等多個維度均取得更優表現,特別適用于需要精準表達復雜語義的生成任務。

在視頻生成任務中,研究者將CFG-Zero?集成到Wan2.1模型中,評估標準采用VBench基準套件。結果表明,改進后的模型在Aesthetic Quality、Imaging Quality、Motion Smoothness等方面均有所提升,呈現出更連貫、結構更穩定的視頻內容。CFG-Zero?有效減少了圖像跳變與不自然的位移問題。


四、實際測試

CFG-Zero?在開源社區中實現了快速落地。目前,該方法已正式集成至ComfyUI與Diffusers官方庫,并被納入視頻生成模型Wan2.1GP的推理流程。借助這些集成,普通開發者與創作者也能輕松體驗該方法帶來的畫質與文本對齊提升。

該方法可以用于圖生視頻,我們使用官方的repo用這張測試圖:


輸入prompt:


得到的視頻如下:(第一個為原始CFG生成的,第二個為CFG-Zero*生成的),效果還是比較明顯,值得嘗試。



該方法對wan2.1 文生視頻同樣適用:(圖1為原始CFG,圖2為CFG-Zero*)



使用的Prompt: " A cat walks on the grass, realistic."

該方法同時兼容LoRA:

使用的LoRA為:

https://civitai.com/models/46080?modelVersionId=1473682



該方法對最強文生圖模型Flux同樣支持:



使用的Prompt:“a tiny astronaut hatching from an egg on the moon.”

該方法實現也比較簡單,作者在附錄中直接附上了代碼,如下圖:


六、總結

該工作在幾乎不引入額外計算量的情況下,提出了一種更好的無分類器引導范式,對所有的流匹配模型都適用,是一種“無痛”漲點方法。從視覺效果來看,優化縮放因子會提升圖片/視頻很多細節,但是不會修正語義信息,零初始化會對整體有比較大的修改,讓圖片更自然,視頻的運動更合理與流暢。但目前該方法只適用于流匹配模型,如何將該方法泛化至其他類型的擴散模型可能是比較有價值的研究方向。

llustration From IconScout By IconScout Store

-The End-

掃碼觀看!

本周上新!

“AI技術流”原創投稿計劃

TechBeat是由將門創投建立的AI學習社區(www.techbeat.net)。社區上線600+期talk視頻,3000+篇技術干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質量、知識型交流平臺,希望為AI人才打造更專業的服務和體驗,加速并陪伴其成長。

投稿內容

// 最新技術解讀/系統性知識分享 //

// 前沿資訊解說/心得經歷講述 //

投稿須知

稿件需要為原創文章,并標明作者信息。

我們會選擇部分在深度技術解析及科研心得方向,對用戶啟發更大的文章,做原創性內容獎勵

投稿方式

發送郵件到

melodybai@thejiangmen.com

或添加工作人員微信(yellowsubbj)投稿,溝通投稿詳情;還可以關注“將門創投”公眾號,后臺回復“投稿”二字,獲得投稿說明。

關于我“門”

將門是一家以專注于數智核心科技領域新型創投機構,也是北京市標桿型孵化器。 公司致力于通過連接技術與商業,發掘和培育具有全球影響力的科技創新企業,推動企業創新發展與產業升級。

將門成立于2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投后服務,歡迎發送或者推薦項目給我“門”:

bp@thejiangmen.com


點擊右上角,把文章分享到朋友圈

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
真相大白?張柏芝隱瞞8年的三胎兒子,身份疑似曝光,謝霆鋒贏了

真相大白?張柏芝隱瞞8年的三胎兒子,身份疑似曝光,謝霆鋒贏了

銀河史記
2025-06-25 15:00:03
阿里大變動,蔣凡離接班人又近了一步?

阿里大變動,蔣凡離接班人又近了一步?

新10億商業參考
2025-06-25 18:51:08
你見過最無知的人是什么樣?網友:尊重他人命運,這種人該被淘汰

你見過最無知的人是什么樣?網友:尊重他人命運,這種人該被淘汰

解讀熱點事件
2025-06-25 00:05:08
這一次,戴蛤蟆頭套賣不出貨的小楊哥,把人走茶涼體現得淋漓盡致

這一次,戴蛤蟆頭套賣不出貨的小楊哥,把人走茶涼體現得淋漓盡致

查爾菲的筆記
2025-06-24 21:15:53
大瓜!唐嫣羅晉也離了?模范夫妻男方長期不回家,休息也不在上海

大瓜!唐嫣羅晉也離了?模范夫妻男方長期不回家,休息也不在上海

扒星人
2025-06-24 15:00:04
央視曝光!又一款陳年老酒暴雷,酒精勾兌、年份造假,溢價超40倍

央視曝光!又一款陳年老酒暴雷,酒精勾兌、年份造假,溢價超40倍

寒士之言本尊
2025-06-24 16:08:29
傾家蕩產也不能治愈?提醒:這6種病根本無法根治,別白花冤枉錢

傾家蕩產也不能治愈?提醒:這6種病根本無法根治,別白花冤枉錢

39健康網
2025-06-24 20:02:57
這瓶“沒貼標簽”的水,出自山姆和農夫山泉的聯手

這瓶“沒貼標簽”的水,出自山姆和農夫山泉的聯手

中國商報
2025-06-25 13:58:08
真慘!河南高考新鮮出爐:本科達線人數不到44萬,達線率不足33%

真慘!河南高考新鮮出爐:本科達線人數不到44萬,達線率不足33%

二月侃事
2025-06-25 16:47:23
李夢宣布不再參加比賽,女籃主帥宮魯鳴回應歡迎其回歸!

李夢宣布不再參加比賽,女籃主帥宮魯鳴回應歡迎其回歸!

杜蘭特
2025-06-25 10:36:04
白玉蘭“視帝”投票排名,靳東僅排第4,于和偉第3,第一憑什么?

白玉蘭“視帝”投票排名,靳東僅排第4,于和偉第3,第一憑什么?

頭號劇委會
2025-06-24 18:38:56
爆!掘金總裁罕見攤牌:頂薪能給,但你也能走人!2.12億頂薪或成“最后談判”

爆!掘金總裁罕見攤牌:頂薪能給,但你也能走人!2.12億頂薪或成“最后談判”

煙潯渺渺
2025-06-25 11:39:47
東北龍鳳胎兄妹高考,妹妹710,哥哥680,媽媽教育方式值得學習

東北龍鳳胎兄妹高考,妹妹710,哥哥680,媽媽教育方式值得學習

星光看娛樂
2025-06-25 13:20:52
匈牙利總理:澤連斯基不會以任何形式出席北約峰會

匈牙利總理:澤連斯基不會以任何形式出席北約峰會

參考消息
2025-06-25 14:51:23
新華社消息|以軍稱對伊朗西部軍事目標發動新一輪打擊

新華社消息|以軍稱對伊朗西部軍事目標發動新一輪打擊

新華社
2025-06-22 15:33:30
俄空軍司令科貝拉乘直升機視察前線被烏軍擊落,當場喪生

俄空軍司令科貝拉乘直升機視察前線被烏軍擊落,當場喪生

環球熱點快評
2025-06-24 09:03:00
還有更猛的交易要來!Shams告訴主持人今晚千萬別睡覺

還有更猛的交易要來!Shams告訴主持人今晚千萬別睡覺

雷速體育
2025-06-25 20:36:29
伊朗總統:12天戰爭結束 重建工作開啟

伊朗總統:12天戰爭結束 重建工作開啟

新華社
2025-06-25 04:00:03
反腐神話:投資七千萬的紅旗渠工程,十年七萬人,零貪腐零瀆職!

反腐神話:投資七千萬的紅旗渠工程,十年七萬人,零貪腐零瀆職!

百科密碼
2025-06-25 15:39:35
“300元路由器中標三峽學院85萬元防火墻項目”:調查已超30個工作日,尚在走處理程序

“300元路由器中標三峽學院85萬元防火墻項目”:調查已超30個工作日,尚在走處理程序

大風新聞
2025-06-24 17:56:03
2025-06-25 21:16:49
將門創投 incentive-icons
將門創投
加速及投資技術驅動型初創企業
2156文章數 591關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

與汪峰節目牽手引猜測 寧靜談擇偶標準:他不是我的菜

頭條要聞

與汪峰節目牽手引猜測 寧靜談擇偶標準:他不是我的菜

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

向佐接機郭碧婷,全程無交流像陌生人

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

售14.99萬/限量200臺 別克昂科威S新增丹霞紅內飾

態度原創

時尚
旅游
健康
本地
軍事航空

挑對耳環=開掛!這15款巨in巨高級,太顯臉小了!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言!

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

軍事要聞

伊朗總統:12天戰爭結束 重建工作開啟

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 集安市| 河东区| 临海市| 明溪县| 南投县| 南雄市| 兰考县| 民乐县| 双流县| 云和县| 同江市| 滨海县| 涟水县| 贞丰县| 和政县| 北川| 栾城县| 利辛县| 肃北| 永安市| 邮箱| 上思县| 海南省| 依安县| 乌苏市| 涟源市| 卓尼县| 河池市| 文登市| 沈阳市| 天津市| 镇沅| 绥中县| 英德市| 灵石县| 盘山县| 疏勒县| 都兰县| 广丰县| 荥经县| 宁夏|