網易首頁 > 網易號 > 正文申請入駐

參數量暴降，精度反升！哈工大賓大聯手打造點云分析新SOTA

2025-05-19 17:36:23　來源: 量子位

北京舉報

分享至

PointKAN團隊投稿
量子位 | 公眾號 QbitAI

新架構選擇用KAN做3D感知，點云分析有了新SOTA！

來自哈爾濱工業大學（深圳）和賓夕法尼亞大學的聯合團隊最近推出了一種基于Kolmogorov-Arnold Networks(KANs)的3D感知解決方案——PointKAN，在處理點云數據的下游任務上展現出巨大的潛力。

PointKAN與同類產品的比較

替代傳統的MLP方案，PointKAN具有更強的學習復雜幾何特征的能力。

此外團隊還提出PointKAN-elite版本，使用Efficient-KANs結構，在保持準確率的同時顯著降低參數量。

以下是更多詳細內容介紹。

為什么要選擇KANs

當前多層感知機（MLPs）憑借其高效的特征學習機制，已成為點云分析的基礎架構組件。

然而在處理點云復雜幾何結構時，MLP的固定激活函數難以有效捕捉局部幾何特征，同時存在參數量冗余大、模型效率低下的問題。

而KANs是以Kolmogorov-Arnold表示定理(KART)作為數學依據的一種新穎的神經網絡架構，與多層感知機(MLP)結構的最大區別是KANs使用可學習函數替代固定激活函數。

KANs使用一維B樣條函數作為基函數通過相加和復合運算實現高維復雜函數，為函數擬合提供了一個靈活且可解釋的框架。

目前，KANs已初步應用于計算機視覺和醫學成像等領域，展現出了有效性和通用性，但在點云分析領域中基于KANs的模型擁有巨大潛力尚未開發。

因此，探索在點云分析任務中有效整合KANs與現有模型的方法，仍是一個重要且有前景的研究方向。

PointKAN框架解析

PointKAN的整體流程如下圖所示。

相比于MLPs，盡管KANs具有更強的高維函數逼近能力和更高的參數效率，但將其適配到3D點云上并非易事。

一方面，KANs的樣條激活函數通過離散節點逼近單變量函數，很難充分捕捉局部點云的幾何特征，限制了其學習細節特征的能力。

另一方面，每一維輸入的激活函數需要存儲多個參數，對于大規模網絡，KANs的內存需求可能成為瓶頸，并且KANs中使用的B樣條函數對于現代硬件上的并行計算未進行優化，導致推理速度較慢。

為了解決上述問題，研究團隊提出了PointKAN，其特點是包含幾何仿射模塊和并行結構的局部特征提取模塊，以及KANs的高效版本Efficient-KANs來減少內存占用并加快訓練和推理速度。

Geometric Affine Module

為了在后續的局部特征提取階段能得到更加豐富的信息，在這個模塊中包含兩個部分Group-Norm和S-Pool。

Group-Norm對分組內特征進行歸一化、仿射變換和組中心特征傳播，整個過程表達如下：

S-Pool用于對各組特征進行聚合，作為后續模塊的輸入，對各組點云進行全局信息的補充，考慮到最大池化會導致信息丟失，而S-Pool則最大限度保留組內各點特征信息，數學形式如下：

Local Feature Processing

對Geometric Affine Module的兩部分輸出在Local Feature Progress(LFP)中分別使用KAN Block進行并行處理。

在KAN Block中，團隊在KAN Layer 后加上深度卷積(DwConv)操作來協助KANs在高維通道信息上學習到豐富的特征表示，整個過程可以被表示為：

共享的LFP旨在從分組點云中學習到局部特征，在經過最大池化后與從各組中心點云學習到的全局信息相加，使得各組點云最終輸出的聚合特征更加豐富。

Global Feature Processing

Global Feature Progress(GFP)由Residual Point(Resp)Block組成，用于提取深度聚合特征。

由于結構中只包含前饋MLP，使得可以在GFP中添加多個重復Residual Point(Resp)Block，整個模型仍然能高效運行。

總的來說，代替使用復雜的局部幾何提取結構，PointKAN的一個階段由Geometric Affine Module、Local Feature Processing和Global Feature Processing三部分組成，通過重復的四個階段來構造一個層次化處理點云的深度網絡。

Efficient-KANs結構

KANs中的激活函數是由B樣條函數生成的，而B樣條函數需要遞歸計算，這并不適合現代GPU的并行計算架構。

在參數量和計算效率上，每個輸入-輸出對都有不同的參數和基函數，那么隨著KANs中隱藏層寬度的增加，參數量呈指數增長，這也導致了巨大的計算開銷和可擴展性問題。

Efficient-KANs很好的解決了這些問題，首先使用有理函數代替B樣條函數作為KANs中的基函數，激活函數如下所示：

其中的參數通過反向傳播進行訓練。有理函數計算過程簡單，非常適合并行計算，提高了模型的計算效率。

另外Efficient-KANs對輸入通道進行分組，在組內進行參數共享，來減少參數量和計算量。

下圖展示了Efficient-KANs、原始KANs和標準MLP之間的區別。

實驗結果

分類任務

在ModelNet40和ScanObjectNN數據集上進行實驗。

部分分割任務

在ShapeNetPart數據集上進行實驗。

小樣本學習

在ModelNet40數據集上采用“n-way, m-shot”范式進行實驗。

實驗結果表明，PointKAN以及PointKAN-elite在各個下游任務上相比于基于MLPs的點云分析架構都有出色的表現，特別是在小樣本學習任務上，體現了KANs具有極強的泛化能力和知識遷移能力，更重要的是參數量和FLOPs都有明顯的下降。

此外消融實驗如下圖所示：

總結

在本文中，研究人員提出了PointKAN，一種基于Kolmogorov-Arnold網絡（KANs）的高效點云分析架構。

相較于基于多層感知機（MLPs）的PointMLP架構，PointKAN在多項任務中均表現出更優性能，充分驗證了KANs在提取局部細節特征方面的強大能力。

此外，研究團隊還提出了更高效的輕量化版本PointKAN-elite，該版本在保持精度的同時，進一步降低了參數量與計算成本。

團隊期待PointKAN能夠推動KANs在點云分析領域的應用，充分發揮其相較于MLPs的獨特優勢。

論文鏈接：https://arxiv.org/abs/2504.13593
代碼鏈接：https://github.com/Shiyan-cps/PointKAN-pytorch

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.