99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

任務無關的自然視頻動態恢復:不需原始視頻即可消除時間閃爍

0
分享至

視頻處理的世界中,有一個惱人的問題困擾著技術人員多年——當我們將圖像處理技術簡單地應用到視頻上時,常常會產生令人不適的時間閃爍。想象一下,你拍攝的風景視頻經過風格化處理后,每一幀都美輪美奐,但播放起來卻像是在閃爍的燈光下觀看,這種不連貫感會大大削弱視覺體驗。以往的解決方案都需要原始未處理的視頻作為參考,這顯然限制了其實用性。而今,一種不依賴原始視頻,直接從帶有閃爍的視頻中學習恢復自然動態的方法應運而生,它如何突破傳統限制、實現更加自然流暢的視頻體驗?這正是本文要探討的核心問題。


閃爍之源

視頻與圖像的本質區別在于時間維度。當我們把針對靜態圖像設計的處理方法簡單地應用到視頻的每一幀上時,就忽視了視頻幀之間的時間連接,這種做法往往會導致嚴重的時間不一致性,也就是我們常說的"閃爍"現象。

這種閃爍可能來自多種原因。比如,對于相鄰的兩幀畫面,盡管內容幾乎相同,但由于全局或局部統計數據的輕微變化,圖像處理方法可能會產生截然不同的結果。以視頻著色為例,一輛車在某段視頻中出現,消失后再次出現,幀間處理可能會在第一次出現時將其著成藍色,第二次出現時又變成紅色。這種不一致性會給觀眾帶來明顯的視覺干擾。

另一個導致閃爍的因素是應用程序的多模態性。對于內容相似的圖像,可能存在多個有效的處理方案。例如在藝術風格遷移中,同一場景可能會有多種風格化表現形式。當這些不同的解決方案被應用到連續的視頻幀時,就會產生明顯的時間閃爍。

目前,有幾種針對特定任務的時間一致性修正方法,如針對風格遷移、上色、去噪等具體應用場景的專門技術。但由于這些應用的復雜性,真正能解決盲目時間一致性修正問題的方法屈指可數。

Bonneel等人在2015年首次研究了盲目時間一致性修正問題,提出了一種基于梯度域最小化的方法,將逐幀處理的視頻與未處理的視頻進行比較,以最小化幀之間的扭曲誤差。Lai等人在2018年擴展了這一方法,利用循環卷積神經網絡并引入了感知懲罰,限制恢復視頻與逐幀處理視頻之間的感知內容偏差。Lei等人提出的深度視頻先驗(DVP)將深度圖像先驗擴展到時間維度,提出通過訓練CNN生成處理后的視頻,而不使用光流。

這些方法都依賴于未處理視頻的可用性,以隱式提取一致的運動動態作為恢復指南。雖然這種方法有效,但這種隱式定義限制了以前提出的方法只能應用于那些原始對應視頻可用的視頻,并且會引入對原始視頻的固有偏見,可能會損害翻譯效果和處理視頻的質量。

例如,在某些情況下,修正后的視頻可能會過度向原始視頻靠攏,導致處理效果被削弱。比如在風格化視頻中,修正過程可能會減少藝術風格的強度,使得畫面更接近原始內容。這種偏向原始視頻的固有偏差在當前可用的方法中非常常見。

自學自用


為了克服上述限制,我們的目標是僅從時間不一致的視頻中學習并推斷一致的運動表示。這樣做不僅消除了在測試階段對原始視頻的需求,還減輕了當前可用方法中常見的對原始視頻的固有偏見。

基于此思路,我們提出了一種雙分支網絡架構,將內容處理和運動處理分離開來。這種架構的核心思想是,通過精心設計的網絡結構,我們可以從不一致的視頻中直接學習到一致的運動表示,而不需要原始視頻作為參考。

具體來說,我們的方法在網絡中集成了光流估計網絡,并通過端到端的方式進行微調。與以往將小型光流估計網絡整合到特定任務中的方法不同,我們采用了一種兩次傳遞機制,并添加了一個編碼器,鼓勵生成一致的動態。

這種雙通道策略允許我們的模型從時間不一致的幀中回歸出一致的運動動態。通過這種設計,我們的網絡能夠有效地利用推斷出的一致運動表示,僅通過考慮測試時的時間不一致視頻就能恢復視頻中的自然時間動態。

我們的網絡包含一個類似UNet的結構,有多個編碼器流和單個解碼器流。解碼器包含來自內容流的跳連接,以鼓勵更好的重建。網絡的瓶頸部分包含一個循環瓶頸塊,用于傳輸和操作生成幀的信息到時間上相距較遠的幀。

運動分支由兩次通過PWCNet(共享權重)組成,隨后是一個常規的類編碼器架構。這種兩通道策略與附加的編碼器一起,使所提出的模型能夠從時間不一致的幀中回歸一致的運動動態。

值得注意的是,通過我們的方法,從時間一致和不一致視頻中估計出的"修改"流是非常相似的,這表明網絡可以有效地利用推斷出的一致運動表示來恢復視頻中的自然時間動態,而不需要在測試時考慮原始視頻。

另一個好處是,這種分離的表示允許用戶通過迭代安排進一步提高恢復的時間一致性水平。這種靈活性使我們的方法能夠適應各種不同的應用場景,從風格遷移到上色,再到圖像增強等多種視頻處理任務。

綜上所述,我們提出的方法通過從不一致視頻中學習一致運動表示,成功解決了視頻處理中的時間一致性問題,同時避免了對原始視頻的依賴。這種方法不僅擴大了應用范圍,還保留了處理效果的完整性,為視頻處理技術提供了一個新的思路。

巧設目標


要讓機器學會恢復視頻的自然流動感,我們需要設計特殊的目標函數,就像教會孩子做事需要給他明確的規則和獎勵一樣。在這項研究中,所設計的目標函數可以分為兩大類:局部鄰域損失和長期時間損失。

局部鄰域損失主要關注相鄰幀之間的連貫性。當我們處理像風格轉換這樣的應用時,處理前后的視頻內容可能差異巨大,簡單的內容匹配重建損失并不適用。因此,研究者提出了一種流梯度損失,它利用光流的空間梯度來監督運動邊界的重建,這恰恰是閃爍現象最明顯的區域。

這種流梯度損失不直接比較原始光流,而是比較光流的梯度信息。這樣做減少了高維光流中的冗余信息,只保留了消除時間閃爍所需的局部時空信息。具體而言,流梯度損失的計算公式為:

Lfg = ∑(t=2到T) ||?(of(Ot, Ot-1)), ?(of(It, It-1))||1

其中,Lfg表示流梯度損失,of表示光流估計網絡,?表示空間梯度操作,T是序列中的總幀數。

不過,單靠光流損失還不足以完全糾正時間一致性,因為光流方程可能有多個解決方案。為了解決這個問題,研究者添加了一個非局部光流重建損失:

Lrecon = ∑(t=2到T) Ct||Ot - t||1

這里,t表示通過光流扭曲前一幀Ot-1得到的估計,Ct是一個遮擋掩碼,用于排除遮擋區域的影響。這個損失函數確保生成的幀與前一幀具有相似的內容,并且合成幀之間的運動動態與時間一致的對應幀相似。

除此之外,研究者還引入了常規的短期感知相似性損失,以最小化合成幀與原始處理幀之間的偏差:

Lp = ∑t∑l||φl(Ot) - φl(Pt)||1

這里,φl(.)表示VGG-16網絡中直到relu_4_3層的層,該網絡在ImageNet數據集上訓練。

前面提到的損失函數擅長處理相鄰幀,但對于遠距離幀的一致性卻無能為力。想象一輛車在視頻中出現,消失,然后再次出現的場景。幀間處理方法可能在第一次賦予它藍色,第二次卻變成紅色。局部損失函數只能確保每段中的顏色一致,但不能保證兩段之間的顏色一致。


為了解決這個問題,研究者在模型中引入了一個遞歸模塊,并添加了強制模型生成時間上連貫的幀的顯式約束。與之前的方法不同,它們簡單地試圖最小化當前幀與序列第一幀的偏差,對于包含大量變化幀的視頻來說是不夠的。因此,研究者引入了一種雙向懲罰,通過局部鄰域損失在后向方向上強制時間平滑,通過提出的長期損失在前向方向上強制時間平滑。

這個被稱為常數損失的長期損失定義為:

Lconstancy = ∑(p=1到T-2)∑(t=p+2到T) Ct?p||Ot - w(Op, of(It-1, Ip))||1

不同于簡單的長期時間約束,這個損失項考慮了序列中所有幀的幀間閃爍,并提供了一個能夠懲罰整個序列中時間差異的強有力的監督信號。

最終的損失函數是這些損失的加權和:

Ltotal = λ1Lfg + λ2Lrecon + λ3Lp + λ4Lconstancy

這里,λs定義了每個損失在優化階段的貢獻。通過這種強時間懲罰和提出的流梯度損失的結合,提出的網絡學會生成更平滑的視頻,盡管在測試時只能訪問逐幀處理的視頻。

實績卓著

經過嚴格的實驗評估,這種不依賴原始視頻的時間一致性恢復方法取得了令人印象深刻的結果。研究者在兩個基準數據集上進行了測試:DAVIS視頻分割數據集和從Videovo.net收集的視頻。這些視頻經過了多種應用處理,包括藝術風格遷移、上色、圖像增強、內在圖像分解和圖像到圖像的翻譯任務。

在實驗階段,研究者測試了各種光流估計網絡。最終選擇了中等大小的PWC-Net網絡和更多的優化迭代,并設計了一個迭代安排,在每次迭代中持續減少扭曲誤差。

對于量化評估,研究者使用了時間扭曲誤差作為主要指標。較低的時間扭曲誤差表示較好的時間一致性。在DAVIS和VIDEVO數據集上,該方法在所有測試的應用中都產生了最低的平均時間扭曲誤差,超過了之前的方法,包括Bonneel等人、Lai等人和DVP的方法。

例如,在DAVIS數據集上,對于WCT(antimono)應用,該方法的扭曲誤差為0.0026,而Bonneel的方法為0.0029,Lai的方法為0.0031,DVP的方法為0.0022。在VIDEVO數據集上,對于相同的應用,該方法的扭曲誤差為0.0015,與Bonneel的方法相當,但低于Lai的方法(0.0021)。


需要注意的是,時間扭曲誤差并不考慮生成幀的感知質量,會給模糊的視頻分配較低的值。為了驗證該方法的有效性,研究者還使用了一種專門用于評估視頻中運動平滑度的指標,并在由DVP處理的評估數據集的一部分上進行了測試。

針對感知質量,研究者還使用了LPIPS指標。在DAVIS數據集上,該方法的平均LPIPS為0.0524,接近Lai方法的0.0445,但明顯優于Bonneel方法的0.1369和DVP方法的0.2414。在VIDEVO數據集上,結果也類似:該方法為0.0556,Lai方法為0.0521,Bonneel方法為0.1523,DVP方法為0.2167。

不過,僅僅依靠這些指標并不能全面評估結果的質量和一致性,因此研究者還進行了用戶研究作為評估的主要標準。

在第一個全面用戶研究中,36名參與者被要求判斷150個不同場景的視頻,這些視頻由各種方法處理。平均而言,41%的用戶更喜歡由該方法恢復的視頻。

在第二個因素化用戶研究中,用戶被要求判斷隨機選擇的15個視頻,并記錄他們選擇的理由。大約86%的參與者表示,他們選擇視頻的依據是較少的閃爍和更好的質量保持。在這些極具挑戰性的任務中,平均約47%的用戶更喜歡通過該方法處理的視頻。

在質性比較中,由Bonneel等人的方法產生的結果在發生遮擋和去遮擋的視頻序列中未能保持感知質量。由DVP處理的幀明顯模糊,并失去了翻譯效果。與Lai等人的方法相比,該方法能夠更忠實地保留恢復幀中的感知質量,不會根據原始視頻翻轉對象的顏色/外觀。


所提出的方法在處理非常低幀率的視頻時確實存在一些困難,在風格轉換視頻的情況下,一些更細微的不一致性(如更細的筆觸)會丟失,這使得結果視頻看起來有點單調。

總的來說,通過從時間不一致的視頻中推斷和利用一致的運動表示,研究者提出了一種任務無關的時間一致性校正框架,可以恢復自然的視頻動態,而不需要在測試時從未處理的視頻中提取視頻動態。這種方法不僅擴大了其在更廣泛的應用中的適用性,還避免了在當前為此任務提出的方法中明顯的翻譯效果的妥協。

參考資料

  1. Ali, M. K., Kim, D., &; Kim, T. H. (2025). Task Agnostic Restoration of Natural Video Dynamics. ICCV.

  2. Bonneel, N., et al. (2015). Blind Video Temporal Consistency.

  3. Lai, W. S., et al. (2018). Learning Blind Video Temporal Consistency.

  4. Lei, C., et al. (2020). Deep Video Prior.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
16位來自江蘇的女星,誰的演技最好?誰才是真正的美女?

16位來自江蘇的女星,誰的演技最好?誰才是真正的美女?

動物奇奇怪怪
2025-06-02 10:44:20
烏稱發起大規模襲擊,“俄34%戰機被摧毀”,俄方回應來了!

烏稱發起大規模襲擊,“俄34%戰機被摧毀”,俄方回應來了!

中國基金報
2025-06-02 08:26:36
香港商家,說30多年了,從來沒有見過如此慘淡的生意

香港商家,說30多年了,從來沒有見過如此慘淡的生意

大風文字
2025-03-05 13:28:25
觀鳥,如何點“綠”成金(視線)

觀鳥,如何點“綠”成金(視線)

金臺資訊
2025-06-02 06:12:38
奧拉迪波:對成全明星感到感激 拿MIP就是錦上添花了

奧拉迪波:對成全明星感到感激 拿MIP就是錦上添花了

直播吧
2025-06-02 12:05:32
58歲才明白,永遠不要在熟人面前,說以下這3句話,切記切記

58歲才明白,永遠不要在熟人面前,說以下這3句話,切記切記

有故事的人
2025-05-10 06:41:06
王櫟鑫給吳雅婷發信息:戒酒能復合嗎?吳雅婷的做法,大家都點贊

王櫟鑫給吳雅婷發信息:戒酒能復合嗎?吳雅婷的做法,大家都點贊

千言娛樂記
2025-06-01 00:51:34
男子監獄30 年出獄換證時,民警一查系統,竟直接“傻眼了”

男子監獄30 年出獄換證時,民警一查系統,竟直接“傻眼了”

故事秘棧
2025-05-29 16:35:52
臺關鍵人物直飛北京,賴清德不想打仗?

臺關鍵人物直飛北京,賴清德不想打仗?

視野聚椒
2025-06-03 01:37:34
對陰道傷害很大的4個行為,很多女性都不知道!

對陰道傷害很大的4個行為,很多女性都不知道!

醫路向前巍子
2025-05-28 14:34:57
妻子癱瘓,兒子成“惡霸”,被排擠的白燕升終于坦白離開內幕

妻子癱瘓,兒子成“惡霸”,被排擠的白燕升終于坦白離開內幕

洲洲影視娛評
2025-06-01 23:00:07
慘遭冷落!韓國中場帝星一拿到歐冠就走人 大巴黎放行 6豪門來搶

慘遭冷落!韓國中場帝星一拿到歐冠就走人 大巴黎放行 6豪門來搶

零度眼看球
2025-06-02 08:20:41
縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

秋風專欄
2025-04-15 17:16:42
年賺14億卻只靠一人撐場?網友:離開了她,品牌根本立不住!

年賺14億卻只靠一人撐場?網友:離開了她,品牌根本立不住!

財經八卦
2025-06-03 00:08:45
陜西65歲阿姨感染艾滋,探查原因后,醫生:這個細節被忽視了

陜西65歲阿姨感染艾滋,探查原因后,醫生:這個細節被忽視了

青青會講故事
2025-04-03 17:10:48
梁朝偉董潔往事還能瞞多久?爆兩人房間滿地成人用品!

梁朝偉董潔往事還能瞞多久?爆兩人房間滿地成人用品!

派大星紀錄片
2024-12-16 17:52:45
壓迫感滿滿!俄方談判團長梅丁斯基回應空軍基地被襲:明日見分曉

壓迫感滿滿!俄方談判團長梅丁斯基回應空軍基地被襲:明日見分曉

起喜電影
2025-06-03 00:13:02
張卓毅母親其實挺慘的!她被想接手的俱樂部給忽悠了

張卓毅母親其實挺慘的!她被想接手的俱樂部給忽悠了

老吳教育課堂
2025-06-02 09:28:19
“沒有假球 全是世仇”!球賽變互懟大會,梗也太密了...這次“散裝”大江蘇贏麻了→

“沒有假球 全是世仇”!球賽變互懟大會,梗也太密了...這次“散裝”大江蘇贏麻了→

上觀新聞
2025-06-02 11:28:53
媒體人:楊瀚森第二站試訓表現依然不錯,未必會參加所有球隊試訓

媒體人:楊瀚森第二站試訓表現依然不錯,未必會參加所有球隊試訓

雷速體育
2025-06-02 12:56:26
2025-06-03 03:39:00
清風鑒史 incentive-icons
清風鑒史
作有深度的歷史解讀
2621文章數 36637關注度
往期回顧 全部

科技要聞

下周的WWDC,蘋果AI依舊不會有“驚喜”

頭條要聞

媒體:烏"奇襲"突破有核國家底線 俄應作出最強烈反擊

頭條要聞

媒體:烏"奇襲"突破有核國家底線 俄應作出最強烈反擊

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

大S女兒來北京!馬筱梅帶她喝下午茶

財經要聞

近期大火的"穩定幣、RWA"是什么?誰將受益?

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

手機
旅游
本地
游戲
公開課

手機要聞

華為nova 14 Ultra評測:質感長焦人像輕松捕捉

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

《荒野大鏢客》約翰演員首玩游戲:透露角色秘密

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 青浦区| 永清县| 延吉市| 利津县| 六安市| 巴东县| 碌曲县| 望都县| 祁东县| 潜江市| 林州市| 江油市| 万山特区| 西畴县| 新丰县| 元谋县| 临漳县| 海晏县| 格尔木市| 威信县| 汨罗市| 龙泉市| 临城县| 苍溪县| 天台县| 若羌县| 临桂县| 兴城市| 隆德县| 监利县| 石台县| 阿克| 雷山县| 龙海市| 前郭尔| 娄底市| 孝义市| 潮州市| 文安县| 巨野县| 稷山县|