智象未來團隊提出全新層級自回歸生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解決自回歸圖像生成中結構失真問題。該研究已被 ICML2025收錄,并在多個圖像生成任務中取得領先性能。
現有自回歸圖像生成模型存在缺乏全局結構建模能力、訓練-推理分布不一致、尺度引導缺失等問題。Hi - MAR 借鑒人類繪畫過程,采用自頂向下層次化生成范式,還引入多尺度聯合訓練策略等。實驗顯示,其在圖像質量和語義一致性上優于主流方法,可以顯著提升模型的全局感知能力與生成質量。
本次發表的論文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了團隊在多模態生成式基礎架構設計領域的前沿探索。這一全新的層級自回歸生成架構 Hi-MAR,為構建具備“全局感知+局部細化”能力的生成基礎架構提供了新的范式,同時它也是HiDream系列開源模型家族重要的一員,為下一代多模態生成式基礎架構的技術演進帶來更多的可能性!
責任編輯:張薇
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.