PointKAN團隊 投稿
量子位 | 公眾號 QbitAI
新架構選擇用KAN做3D感知,點云分析有了新SOTA!
來自哈爾濱工業大學(深圳)和賓夕法尼亞大學的聯合團隊最近推出了一種基于Kolmogorov-Arnold Networks(KANs)的3D感知解決方案——PointKAN,在處理點云數據的下游任務上展現出巨大的潛力。
PointKAN與同類產品的比較
替代傳統的MLP方案,PointKAN具有更強的學習復雜幾何特征的能力。
此外團隊還提出PointKAN-elite版本,使用Efficient-KANs結構,在保持準確率的同時顯著降低參數量。
以下是更多詳細內容介紹。
為什么要選擇KANs
當前多層感知機(MLPs)憑借其高效的特征學習機制,已成為點云分析的基礎架構組件。
然而在處理點云復雜幾何結構時,MLP的固定激活函數難以有效捕捉局部幾何特征,同時存在參數量冗余大、模型效率低下的問題。
而KANs是以Kolmogorov-Arnold表示定理(KART)作為數學依據的一種新穎的神經網絡架構,與多層感知機(MLP)結構的最大區別是KANs使用可學習函數替代固定激活函數。
KANs使用一維B樣條函數作為基函數通過相加和復合運算實現高維復雜函數,為函數擬合提供了一個靈活且可解釋的框架。
目前,KANs已初步應用于計算機視覺和醫學成像等領域,展現出了有效性和通用性,但在點云分析領域中基于KANs的模型擁有巨大潛力尚未開發。
因此,探索在點云分析任務中有效整合KANs與現有模型的方法,仍是一個重要且有前景的研究方向。
PointKAN框架解析
PointKAN的整體流程如下圖所示。
相比于MLPs,盡管KANs具有更強的高維函數逼近能力和更高的參數效率,但將其適配到3D點云上并非易事。
一方面,KANs的樣條激活函數通過離散節點逼近單變量函數,很難充分捕捉局部點云的幾何特征,限制了其學習細節特征的能力。
另一方面,每一維輸入的激活函數需要存儲多個參數,對于大規模網絡,KANs的內存需求可能成為瓶頸,并且KANs中使用的B樣條函數對于現代硬件上的并行計算未進行優化,導致推理速度較慢。
為了解決上述問題,研究團隊提出了PointKAN,其特點是包含幾何仿射模塊和并行結構的局部特征提取模塊,以及KANs的高效版本Efficient-KANs來減少內存占用并加快訓練和推理速度。
Geometric Affine Module
為了在后續的局部特征提取階段能得到更加豐富的信息,在這個模塊中包含兩個部分Group-Norm和S-Pool。
Group-Norm對分組內特征進行歸一化、仿射變換和組中心特征傳播,整個過程表達如下:
S-Pool用于對各組特征進行聚合,作為后續模塊的輸入,對各組點云進行全局信息的補充,考慮到最大池化會導致信息丟失,而S-Pool則最大限度保留組內各點特征信息,數學形式如下:
Local Feature Processing
對Geometric Affine Module的兩部分輸出在Local Feature Progress(LFP)中分別使用KAN Block進行并行處理。
在KAN Block中,團隊在KAN Layer 后加上深度卷積(DwConv)操作來協助KANs在高維通道信息上學習到豐富的特征表示,整個過程可以被表示為:
共享的LFP旨在從分組點云中學習到局部特征,在經過最大池化后與從各組中心點云學習到的全局信息相加,使得各組點云最終輸出的聚合特征更加豐富。
Global Feature Processing
Global Feature Progress(GFP)由Residual Point(Resp)Block組成,用于提取深度聚合特征。
由于結構中只包含前饋MLP,使得可以在GFP中添加多個重復Residual Point(Resp)Block,整個模型仍然能高效運行。
總的來說,代替使用復雜的局部幾何提取結構,PointKAN的一個階段由Geometric Affine Module、Local Feature Processing和Global Feature Processing三部分組成,通過重復的四個階段來構造一個層次化處理點云的深度網絡。
Efficient-KANs結構
KANs中的激活函數是由B樣條函數生成的,而B樣條函數需要遞歸計算,這并不適合現代GPU的并行計算架構。
在參數量和計算效率上,每個輸入-輸出對都有不同的參數和基函數,那么隨著KANs中隱藏層寬度的增加,參數量呈指數增長,這也導致了巨大的計算開銷和可擴展性問題。
Efficient-KANs很好的解決了這些問題,首先使用有理函數代替B樣條函數作為KANs中的基函數,激活函數如下所示:
其中的參數通過反向傳播進行訓練。有理函數計算過程簡單,非常適合并行計算,提高了模型的計算效率。
另外Efficient-KANs對輸入通道進行分組,在組內進行參數共享,來減少參數量和計算量。
下圖展示了Efficient-KANs、原始KANs和標準MLP之間的區別。
實驗結果
分類任務
在ModelNet40和ScanObjectNN數據集上進行實驗。
部分分割任務
在ShapeNetPart數據集上進行實驗。
小樣本學習
在ModelNet40數據集上采用“n-way, m-shot”范式進行實驗。
實驗結果表明,PointKAN以及PointKAN-elite在各個下游任務上相比于基于MLPs的點云分析架構都有出色的表現,特別是在小樣本學習任務上,體現了KANs具有極強的泛化能力和知識遷移能力,更重要的是參數量和FLOPs都有明顯的下降。
此外消融實驗如下圖所示:
總結
在本文中,研究人員提出了PointKAN,一種基于Kolmogorov-Arnold網絡(KANs)的高效點云分析架構。
相較于基于多層感知機(MLPs)的PointMLP架構,PointKAN在多項任務中均表現出更優性能,充分驗證了KANs在提取局部細節特征方面的強大能力。
此外,研究團隊還提出了更高效的輕量化版本PointKAN-elite,該版本在保持精度的同時,進一步降低了參數量與計算成本。
團隊期待PointKAN能夠推動KANs在點云分析領域的應用,充分發揮其相較于MLPs的獨特優勢。
論文鏈接:https://arxiv.org/abs/2504.13593
代碼鏈接:https://github.com/Shiyan-cps/PointKAN-pytorch
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.