99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

圖像生成直逼GPT-4o!港科&快手開源測試時擴展新范式

0
分享至



論文第一作者為何浩然,香港科技大學二年級博士,他的研究方向包括強化學習、生成流模型(GFlowNets)以及具身智能,通訊作者為香港科技大學電子與計算機工程系、計算機科學與工程系助理教授潘玲。

測試時擴展(Test-Time Scaling)極大提升了大語言模型的性能,涌現出了如 OpenAI o 系列模型和 DeepSeek R1 等眾多爆款。那么,什么是視覺領域的 test-time scaling?又該如何定義?

為了回答這一問題,最近香港科技大學聯合快手可靈團隊推出Evolutionary Search (EvoSearch)方法,通過提高推理時的計算量來大幅提升模型的生成質量,支持圖像和視頻生成,支持目前最先進的 diffusion-based 和 flow-based 模型。EvoSearch 無需訓練,無需梯度更新,即可在一系列任務上取得顯著最優效果,并且表現出良好的 scaling up 能力、魯棒性和泛化性。

隨著測試時計算量提升,EvoSearch 表明 SD2.1 和 Flux.1-dev 也有潛力媲美甚至超過 GPT4o。對于視頻生成,Wan 1.3B 也能超過 Wan 14B 和 Hunyuan 13B,展現了 test-time scaling 補充 training-time scaling 的潛力和研究空間

目前,該項目的論文和代碼均已開源。



  • 論文標題:Scaling Image and Video Generation via Test-Time Evolutionary Search
  • 項目主頁:https://tinnerhrhe.github.io/evosearch/
  • 代碼:https://github.com/tinnerhrhe/EvoSearch-codes
  • 論文:https://arxiv.org/abs/2505.17618



我們來看 EvoSearch 與其他一些方法的效果對比:



1.Test-Time Scaling 的本質

這里團隊將測試時擴展(Test-Time Scaling)和 RL post-training 分開來看,定義前者無需參數更新,后者需要計算資源進行后訓練。Test-time scaling 和 RL post-training 本質都是為了激發預訓練模型的能力,使其與人類偏好(獎勵)對齊。給定一個預訓練模型和獎勵函數,目的是擬合如下的目標分布:







其中是歸一化常數,需要遍歷整個狀態空間來計算。這是不可行的,因為 diffusion 和 flow 模型的狀態空間都是高維的。這導致直接從目標分布采樣不可行

2. 當前方法的局限性

諸如 RL 的后訓練方法雖然也能從目標分布采樣,但需要構造數據以及大量計算資源重新更新模型參數,導致代價很大并且很難 scale up。目前在視覺領域,最有效的 test-time scaling 方法包括 Best-of-N,它基于重要性采樣(Importance Sampling)來擬合目標分布采樣。Best-of-N 隨機采樣多個樣本,并篩選出獎勵最高的 N 個。在基于 diffusion 和 flow 模型的圖像和視頻生成任務上,Best-of-N 的樣本通常是初始噪聲。

最近的一些工作提出了更高級的采樣方法,可以統一稱為 Particle Sampling。這類方法將搜索空間拓展為整條去噪軌跡,在去噪過程中不斷保留好的樣本,并丟掉表現差的樣本(類似 beam search)。這類方法雖然也能表現出 scaling up 性質,但缺少探索新的狀態空間能力,并且會減少生成樣本的多樣性

團隊做了一個小實驗,當目標分布和預訓練分布不一致(甚至可能是 o.o.d.),基于學習的 RL 方法會出現獎勵過優化的現象(reward over-optimization)。諸如 best-of-N 和 particle sampling 的搜索方法也不能找到目標分布所有的模態。但團隊的方法 EvoSearch 成功擬合了目標分布,并且取得了最高的獎勵值



3. EvoSearch 解讀

團隊將圖像和視頻生成的 test-time scaling 問題重構成演化搜索問題。





EvoSearch 框架圖

團隊的方法受如下的洞見啟發:他們發現在整個去噪軌跡中,高質量的樣本往往會聚集在一起。因此,當搜索到高質量的父代,則可以在父代周圍的空間進行探索從而有效找到更高質量的樣本。從下圖可以看到去噪軌跡中的樣本在低維空間的分布與獎勵空間具有強相關性。



基于此,團隊設計了如下兩種變異模式:

  • 初始噪聲變異:EvoSearch 通過如下正交操作保持初始噪聲仍然符合高斯分布





這些變異方式一方面加強了對于新的狀態空間探索,另一方面又避免了偏離去噪軌跡的預訓練分布。

我們定義了evolution schedulepopulation size schedule來進行演化搜索,這兩種 schedule 的設置取決于可用的測試時計算量大小。



EvoSearch 算法偽代碼如下:





4.EvoSearch 實驗結果

1. 對于圖片生成任務,在 Stable Diffusion 2.1 和 Flux.1-dev 上,EvoSearch 展示了最優的 scaling up 性質。即使測試時計算量擴大了 1e4 量級,仍能保持上升勢頭。對于視頻生成任務,EvoSearch 在 VBench,VBench2.0 以及 VideoGen-Eval 中的 prompts 上也能達到最高的 reward 提升幅度。



2.EvoSearch 也能泛化到分布外(unseen)的評估指標,顯示了最優的泛化性和魯棒性。



3. EvoSearch 在人類評估上也達到最優勝率。這得益于他高的生成多樣性,平衡了 exploration 和 exploitation。



4. 下面是更多的可視化結果:







更多細節請見原論文和項目網站。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Shams:尼克斯想與森林狼和火箭談判芬奇和烏度卡,均遭拒絕

Shams:尼克斯想與森林狼和火箭談判芬奇和烏度卡,均遭拒絕

懂球帝
2025-06-11 11:33:39
教育部:擬同意設置大灣區大學等10所高校

教育部:擬同意設置大灣區大學等10所高校

經濟觀察報
2025-06-11 15:49:20
局面已經變了,外媒已經有所察覺!

局面已經變了,外媒已經有所察覺!

靜思有我
2025-06-10 15:01:01
江蘇氣象最新發布:10級雷暴大風!37℃高溫!入梅時間也定了

江蘇氣象最新發布:10級雷暴大風!37℃高溫!入梅時間也定了

江蘇警方
2025-06-11 20:30:20
新型的賣淫方式已出現了,真的讓人防不勝防,每個人都要警惕!

新型的賣淫方式已出現了,真的讓人防不勝防,每個人都要警惕!

小熊侃史
2024-12-06 07:10:14
是時候打破英語神話、把英語趕下高考神壇、奪回語言主權了!

是時候打破英語神話、把英語趕下高考神壇、奪回語言主權了!

李光滿說
2025-06-11 17:53:58
溫州二高喜報!太牛了

溫州二高喜報!太牛了

溫曉生
2025-06-11 21:37:14
網友:530萬的房子貸款270萬,剛住進去就虧200萬…蘇州工業園區

網友:530萬的房子貸款270萬,剛住進去就虧200萬…蘇州工業園區

小人物看盡人間百態
2025-06-10 14:04:33
吉利汽車集團:將供應商支付賬期統一至60天內

吉利汽車集團:將供應商支付賬期統一至60天內

財聯社
2025-06-10 23:35:06
凌晨2點,隨著一場0-2大爆冷,鄭欽文迎來利好消息,有望直通4強

凌晨2點,隨著一場0-2大爆冷,鄭欽文迎來利好消息,有望直通4強

大秦壁虎白話體育
2025-06-11 08:29:48
東莞最失落的兩個鎮——無疑是石龍鎮和樟木頭鎮!

東莞最失落的兩個鎮——無疑是石龍鎮和樟木頭鎮!

人情皆文史
2025-06-06 04:55:55
美國網友投票:寧可要非法墨西哥移民,也不要合法印度移民!

美國網友投票:寧可要非法墨西哥移民,也不要合法印度移民!

阿龍聊軍事
2025-06-11 16:42:32
2-1逆轉,澳大利亞4連勝+以小組第二晉級世界杯,沙特參加附加賽

2-1逆轉,澳大利亞4連勝+以小組第二晉級世界杯,沙特參加附加賽

側身凌空斬
2025-06-11 04:13:08
美媒評史上最讓人意外的5位FMVP:場均9分獲獎,輸球也能拿FMVP

美媒評史上最讓人意外的5位FMVP:場均9分獲獎,輸球也能拿FMVP

大衛的籃球故事
2025-06-11 19:42:35
很多地方已經可以喝到1499元的茅臺了!

很多地方已經可以喝到1499元的茅臺了!

阿萊美食匯
2025-06-08 18:44:47
跟沒穿有啥區別,范冰冰真空穿深V,領口開到肚臍,裙開到大腿根

跟沒穿有啥區別,范冰冰真空穿深V,領口開到肚臍,裙開到大腿根

說真話的小陳
2025-05-28 10:18:49
高溫來襲,心臟壓力大!中醫推薦一種食物,每吃一口都賺到!

高溫來襲,心臟壓力大!中醫推薦一種食物,每吃一口都賺到!

人民日報健康客戶端
2025-06-10 21:11:54
被裁員也不怕!45歲大叔靠"懶人生意"月入5萬,方法全公開

被裁員也不怕!45歲大叔靠"懶人生意"月入5萬,方法全公開

月影說職場
2025-06-04 16:51:17
第1現場|抗議蔓延全美多地,特朗普威脅動用《反叛亂法》

第1現場|抗議蔓延全美多地,特朗普威脅動用《反叛亂法》

澎湃新聞
2025-06-11 18:40:29
《哪吒2》全球票房21.92億美元,還差7400萬就能拿到第四

《哪吒2》全球票房21.92億美元,還差7400萬就能拿到第四

影視高原說
2025-06-10 07:42:32
2025-06-12 00:39:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10622文章數 142336關注度
往期回顧 全部

科技要聞

華為Pura80 Ultra最高定價10999元

頭條要聞

樊振東乒超7連勝 王楚欽坦言:沒人敢說有信心贏他

頭條要聞

樊振東乒超7連勝 王楚欽坦言:沒人敢說有信心贏他

體育要聞

一位中國老板,復興了歐洲百年俱樂部

娛樂要聞

那爾那茜定向委培違約事件 持續發酵

財經要聞

美法院為何決定暫時維持特朗普關稅?

汽車要聞

5萬級5座純電微型車 奇瑞QQ多米正式上市

態度原創

本地
房產
藝術
公開課
軍事航空

本地新聞

非遺里的河南 | 黃河泥變身千年墨寶,寫字都帶仙氣兒~

房產要聞

曝光!食堂問題頻發,海口這所名校被重罰百萬!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

加州請求阻止特朗普政府派兵被駁回

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 徐州市| 新绛县| 神池县| 烟台市| 白城市| 阜新| 胶州市| 施甸县| 镇赉县| 集贤县| 正阳县| 噶尔县| 玉树县| 拜城县| 黄龙县| 高邑县| 沧州市| 翁牛特旗| 扶沟县| 陆丰市| 平顶山市| 桐城市| 汪清县| 安图县| 聂拉木县| 三江| 潼关县| 马龙县| 河池市| 宁化县| 全椒县| 偏关县| 大厂| 师宗县| 黄山市| 甘谷县| 新邵县| 尚志市| 华蓥市| 汕尾市| 澎湖县|