本文由東華大學(xué)蔡棽副教授、上海交通大學(xué)嚴(yán)駿馳教授和中國(guó)科學(xué)院自動(dòng)化所申抒含研究員共同指導(dǎo)并撰寫,四名學(xué)生作者為東華大學(xué)視覺與幾何感知實(shí)驗(yàn)室的吳展豪、郭凌希、王佳純、張斯禹。
一、論文簡(jiǎn)介
東華大學(xué)、上海交通大學(xué)、中科院自動(dòng)化所的研究團(tuán)隊(duì)最新提出:兩種基于幾何的單應(yīng)矩陣分解,極大地減少了四點(diǎn)求解單應(yīng)的計(jì)算量(相比目前通用的求解稀疏線性方程組方法減少 95% 以上),可在二維碼掃描等典型視覺應(yīng)用中顯著減少計(jì)算消耗,并有望應(yīng)用于其他射影幾何、計(jì)算機(jī)視覺和圖形學(xué)問題中。
論文已被 IEEE T-PAMI 期刊接收。
- 論文標(biāo)題:Fast and Interpretable 2D Homography Decomposition: Similarity-Kernel-Similarity and Af?ne-Core-Af?ne Transformations
- 論文主頁鏈接(含論文、代碼、視頻介紹、獎(jiǎng)金激勵(lì)):http://www.cscvlab.com/research/SKS-Homography
二、問題介紹
以往的直接線性變換(Direct Linear Transformation, DLT)方法利用上述約束構(gòu)建稀疏線性方程組進(jìn)行單應(yīng)求解,其中常用的一種非齊次線性方程組構(gòu)建方法為:
三、本文方法
核心思想
基于幾何變換的層次性(相似 - 仿射 - 射影),逐步利用部分點(diǎn)求出子變換,從而將單應(yīng)矩陣分解為多個(gè)子變換完成分別求解并相乘。
- 【相似 - 相似射影核 - 相似(Similariry-Kernel-Similarity, SKS)變換】
ACA 變換是極其高效的,其計(jì)算單應(yīng)矩陣的浮點(diǎn)運(yùn)算次數(shù)統(tǒng)計(jì)見下表。在相差一個(gè)比例因子下單應(yīng)計(jì)算共計(jì) 85 次浮點(diǎn)運(yùn)算。表下方同時(shí)給出了一些計(jì)算量統(tǒng)計(jì)的細(xì)節(jié)(可通過其中加、減、乘號(hào)的數(shù)目進(jìn)行統(tǒng)計(jì))。
- 【正方形模板的簡(jiǎn)化】
當(dāng)四個(gè)源點(diǎn)構(gòu)成一個(gè)特殊形狀,ACA 算法的計(jì)算過程可以進(jìn)一步簡(jiǎn)化。以下算法展示了矩形(或正方形)模版與其圖像間單應(yīng)的計(jì)算過程,分別需要 47 和 44 次浮點(diǎn)運(yùn)算。
四、實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)主要集中在評(píng)估 4 點(diǎn)單應(yīng)求解器在不同場(chǎng)景下的運(yùn)行時(shí)間,下面給出了 CPU 和 GPU 計(jì)算一個(gè)單應(yīng)的平均運(yùn)行時(shí)間對(duì)比。
更多的實(shí)驗(yàn)結(jié)果,如集成在 RANSAC 流程、集成在深度單應(yīng)估計(jì)網(wǎng)絡(luò)中求取單應(yīng),詳見論文原文。
結(jié)果顯示,使用雙精度浮點(diǎn)數(shù),ACA 分解完成一次四點(diǎn)單應(yīng)計(jì)算的平均時(shí)間僅為 17 納秒。與 DLT+LU 相比,SKS 和 ACA 在開啟編譯器默認(rèn)的 O2 優(yōu)化下分別實(shí)現(xiàn)了 29 倍和 43 倍的實(shí)際加速比。這兩個(gè)數(shù)值遠(yuǎn)超理論上 FLOPs 的 11 倍和 20 倍比值,部分因?yàn)橐酝椒ǖ膶?shí)現(xiàn)涉及條件判斷、數(shù)據(jù)拷貝等操作拖慢了執(zhí)行速度,而這些操作并沒有被 FLOPs 統(tǒng)計(jì)所覆蓋。
五、總結(jié)與展望
作為一項(xiàng)幾何視覺理論研究,本文提出的 SKS 與 ACA 方法可廣泛應(yīng)用于基于平面的視覺或圖形學(xué)任務(wù)中。目前,研究團(tuán)隊(duì)在深度學(xué)習(xí)估計(jì)單應(yīng)的幾何參數(shù)、基于平面單應(yīng)的 P3P 姿態(tài)估計(jì)、N 維單應(yīng)矩陣分解等問題開展了后續(xù)研究,取得了一些初步成果。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.