99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達等Difix3D+:用單步擴散模型修復 3D 重建偽影

0
分享至



在 3D 重建領(lǐng)域,無論是 NeRF 還是最新的 3D Gaussian Splatting(3DGS),在生成逼真新視角時仍面臨一個核心難題:視角一旦偏離訓練相機位置,圖像就容易出現(xiàn)模糊、鬼影、幾何錯亂等偽影,嚴重影響實際應(yīng)用。

為了解決這個問題,來自英偉達的研究團隊聯(lián)合提出了一種創(chuàng)新方案 ——Difix3D+,通過單步擴散模型對 3D 渲染結(jié)果進行 “圖像修復”,顯著提升新視角圖像的質(zhì)量和一致性。該工作已被 CVPR 2025 接收,并入選Best Paper Award 候選。



  • 項目主頁:https://research.nvidia.com/labs/toronto-ai/difix3d
  • 論文地址:https://arxiv.org/abs/2503.01774
  • 代碼地址:https://github.com/nv-tlabs/Difix3D



背景:3D 重建的 “致命短板”

近年來,NeRF(神經(jīng)輻射場)和 3D Gaussian Splatting(3DGS)等技術(shù)在三維重建與新視角合成中取得突破。然而,在訓練相機視角之外,這些方法往往會出現(xiàn)模糊、鬼影、幾何錯亂等偽影,尤其在視角跨度較大、數(shù)據(jù)稀疏、光照變化或相機標定不準確的情況下尤為嚴重。這些偽影極大限制了其在自動駕駛、機器人、AR/VR 等真實場景中的應(yīng)用。

這主要是因為傳統(tǒng)方法過度依賴局部一致性和 per-scene 優(yōu)化流程,缺乏跨場景泛化能力,且無法有效填補觀測稀疏區(qū)域的 “空洞”。

關(guān)鍵洞察:2D 擴散模型為何能 “修好” 3D?

Difix3D+提出了一個突破性的視角:將預訓練 2D 擴散模型的視覺先驗引入 3D 渲染流程,將其作為 “圖像修復器”,精準去除神經(jīng)渲染偽影。

這一設(shè)計基于一個關(guān)鍵觀察:神經(jīng)渲染偽影的分布,與擴散模型訓練過程中的噪聲圖像分布驚人地相似。



為驗證這一點,研究者將渲染圖輸入擴散模型進行單步 “去噪”,并系統(tǒng)性測試不同噪聲強度(t)的效果 ——

  • 高噪聲(t=600):雖然偽影被去除,但內(nèi)容也嚴重變形
  • 低噪聲(t=10):圖像結(jié)構(gòu)完整,但偽影幾乎未去除
  • 中等噪聲(t=200):在保留語義結(jié)構(gòu)的同時,有效消除了渲染偽影

這一發(fā)現(xiàn)使得單步擴散模型成為 “修復” NeRF/3DGS 渲染圖的理想選擇,不僅效率高,而且具備泛化能力。



Difix 具備以下核心優(yōu)勢:

1. 單步擴散:發(fā)現(xiàn)渲染偽影的分布在 t=200 處最接近擴散模型訓練數(shù)據(jù),DIFIX 可一次去除偽影并保留語義結(jié)構(gòu)。

2. 無需大量訓練:僅需在消費級 GPU 上訓練幾個小時,即可適配 NeRF/3DGS 的渲染偽影;

3. 支持多種 3D 表征:同一個模型可同時修復 NeRF(隱式)與 3DGS(顯式)渲染;

4. 近實時推理:在 NVIDIAA100上,僅需 76ms 即可完成圖像修復,比傳統(tǒng)多步擴散快 10 倍以上。

5. 可進可退:修復后的圖像還能反向蒸餾回 3D 模型,提升整體建模精度和一致性。

解決方案:DIFIX3D+ = 擴散模型 + 蒸餾增強 + 實時修復

DIFIX3D+ 以一個經(jīng)過少量微調(diào)的單步擴散模型(DIFIX)為核心模塊,結(jié)合漸進式優(yōu)化策略,構(gòu)建出一個無需修改原始 3D 重建結(jié)構(gòu)即可增強視覺質(zhì)量的插件化系統(tǒng)。



核心三步流程:

Step 1:DIFIX 修復中間視角圖像。從訓練視角向目標視角進行插值采樣,生成中間視角圖,并用 DIFIX 去除偽影。

Step 2:蒸餾至 3D 表示。將修復后的圖像 “反向蒸餾” 回 3D 表示中,逐步提升建模質(zhì)量與區(qū)域覆蓋度。

Step 3:推理時再修復。最終渲染出的圖像,再次通過 DIFIX 后處理,消除殘留細節(jié)錯誤,僅需 76ms,支持實時渲染。

實驗結(jié)果一覽:效果、指標全面領(lǐng)先



支持 NeRF、3DGS 多種 3D 表征。





FID 降幅超過 60%~70%,LPIPS 接近 SOTA 一半,大幅領(lǐng)先其他方法。

此外,在自動駕駛場景中(橫向 6 米偏移或仰角 30°),DIFIX3D+ 仍能維持視角一致性與圖像清晰度,極具工程落地價值。



結(jié)語:讓 2D 模型 “反哺” 3D,打開新一代 3D 重建大門

DIFIX3D+ 展示了 2D 擴散模型在 3D 渲染修復中的巨大潛力。它無需改變原始建模流程,即可顯著提升重建質(zhì)量,為未來更加通用、智能、高效的 3D 場景生成與理解提供了堅實基礎(chǔ)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
大反攻!又傳出新消息。。

大反攻!又傳出新消息。。

格隆匯
2025-06-23 15:45:05
心衰與缺鉀有關(guān)!醫(yī)生建議多吃2種天然補鉀食物

心衰與缺鉀有關(guān)!醫(yī)生建議多吃2種天然補鉀食物

心血管科王亞紅主任
2025-06-22 13:00:03
以軍:襲擊伊朗6個機場!伊副外長:伊朗將繼續(xù)鈾濃縮活動!伊代表稱這次將向世界展示伊朗力量

以軍:襲擊伊朗6個機場!伊副外長:伊朗將繼續(xù)鈾濃縮活動!伊代表稱這次將向世界展示伊朗力量

每日經(jīng)濟新聞
2025-06-23 15:02:09
公務(wù)員吃空餉大整頓!這6類人員將被重點清退,一個都跑不掉!

公務(wù)員吃空餉大整頓!這6類人員將被重點清退,一個都跑不掉!

愛下廚的阿椅
2025-06-22 05:30:42
敘突發(fā)自殺式襲擊,22死63傷!中方多次苦口婆心,沙拉該要聽進了

敘突發(fā)自殺式襲擊,22死63傷!中方多次苦口婆心,沙拉該要聽進了

近史博覽
2025-06-23 11:48:21
第一個力挺伊朗的戰(zhàn)友出現(xiàn)!只要美國敢出兵,立馬使出3大絕招

第一個力挺伊朗的戰(zhàn)友出現(xiàn)!只要美國敢出兵,立馬使出3大絕招

閱識
2025-06-23 11:14:50
王石再預測中國未來房地產(chǎn)走向:若無意外,大概率又是對的!

王石再預測中國未來房地產(chǎn)走向:若無意外,大概率又是對的!

巢客HOME
2025-03-21 09:10:03
洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

嘆知
2025-06-23 10:34:33
伊朗為何不主動倒向中國?

伊朗為何不主動倒向中國?

華山穹劍
2025-06-20 21:02:05
你愿不愿意在小縣城待一輩子?網(wǎng)友把小縣城真相扒得底褲都不剩了

你愿不愿意在小縣城待一輩子?網(wǎng)友把小縣城真相扒得底褲都不剩了

墻頭草
2025-06-22 10:14:52
3名廳官被查,3個月前他剛履新

3名廳官被查,3個月前他剛履新

魯中晨報
2025-06-22 10:21:08
明日花綺羅被周鶴年背后環(huán)抱!日媒爆親密照…路人目擊不放手

明日花綺羅被周鶴年背后環(huán)抱!日媒爆親密照…路人目擊不放手

ETtoday星光云
2025-06-23 11:19:28
7月來臨,三大生肖否極泰來,接財大運收入暴漲

7月來臨,三大生肖否極泰來,接財大運收入暴漲

人閒情事
2025-06-23 17:39:04
河南16歲少年跳河救起落水女子后不幸身亡,爸爸悲痛發(fā)聲:媽媽看見同齡孩子會哭到昏厥,我年輕時也曾跳水救人

河南16歲少年跳河救起落水女子后不幸身亡,爸爸悲痛發(fā)聲:媽媽看見同齡孩子會哭到昏厥,我年輕時也曾跳水救人

極目新聞
2025-06-22 18:26:28
下賽季見,皇馬向三家西甲升班馬送上祝賀

下賽季見,皇馬向三家西甲升班馬送上祝賀

懂球帝
2025-06-23 01:02:30
會特朗普后,巴基斯坦將推動加密貨幣,中國百億美元投資打水漂?

會特朗普后,巴基斯坦將推動加密貨幣,中國百億美元投資打水漂?

忠誠TALK
2025-06-23 14:17:51
伊朗高官落地莫斯科當天,普京政府放出風聲:核彈頭已經(jīng)準備就緒

伊朗高官落地莫斯科當天,普京政府放出風聲:核彈頭已經(jīng)準備就緒

阿芒娛樂說
2025-06-23 17:41:35
最后48小時,李在明再一次主動放棄,和特朗普見面的機會

最后48小時,李在明再一次主動放棄,和特朗普見面的機會

曹興教授TALK
2025-06-23 17:06:34
這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

這是阿嬌你敢相信嗎?看著也不胖啊!而且非常平板該有的都沒看到

素衣讀史
2025-06-21 14:13:38
光刻機概念股走強

光刻機概念股走強

澎湃新聞
2025-06-23 10:08:06
2025-06-23 18:56:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10700文章數(shù) 142343關(guān)注度
往期回顧 全部

科技要聞

售出千萬臺!他卻說"只想做下一代AI終端"

頭條要聞

奔襲萬里的美B-2轟炸機內(nèi)部披露 返航通話錄音被截獲

頭條要聞

奔襲萬里的美B-2轟炸機內(nèi)部披露 返航通話錄音被截獲

體育要聞

比起雷霆三少,他才是真正隊魂

娛樂要聞

魏大勛和秦嵐沒分手!

財經(jīng)要聞

美國打擊伊朗,為何全球市場依然淡定?

汽車要聞

真香價格+質(zhì)保承諾 別克E5很難讓人拒絕了

態(tài)度原創(chuàng)

健康
家居
教育
藝術(shù)
數(shù)碼

呼吸科專家破解呼吸道九大謠言!

家居要聞

山水之間 墨染風雨云間

教育要聞

重要通知!2025高考查分時間“一覽表”出爐,多省志愿填報時間已定

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

數(shù)碼要聞

羅德 Wireless Go 3 彩色版無線麥克風開售,1995 元

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 敖汉旗| 彰化县| 会泽县| 寻甸| 博兴县| 四平市| 寿光市| 丰原市| 台湾省| 沙湾县| 白河县| 邢台县| 乳源| 于田县| 志丹县| 新平| 汉阴县| 北京市| 汉中市| 顺昌县| 四子王旗| 集贤县| 白沙| 桂阳县| 五河县| 育儿| 黄平县| 从化市| 来安县| 建瓯市| 新巴尔虎左旗| 瓮安县| 泰宁县| 馆陶县| 治多县| 河源市| 鹤岗市| 沽源县| 怀化市| 平凉市| 桐柏县|