深圳大學黃惠團隊獨立推出 CLR-Wire:連續潛空間驅動的三維曲線框生成方法,首次實現了將復雜的三維曲線框結構統一編碼到連續的潛空間中,解決了傳統方法難以同時有效捕捉線框幾何和拓撲信息的難題。這一創新技術能夠實現復雜三維結構的高效生成與平滑插值,在工業設計、三維重建及內容創作等領域具有廣泛的實際應用前景。第一作者為深圳大學可視計算研究中心 (VCC) 博士研究生馬雪奇,合作者劉奕林、高天龍、黃期瑞均為 VCC 研究生。CLR-Wire 相關代碼已全面開源,歡迎大家試用和建議。
- 項目主頁:https://vcc.tech/research/2025/CLRWire
- 項目代碼:https://github.com/qixuema/CLR-Wire
- 論文鏈接:https://arxiv.org/abs/2504.19174
在計算機圖形學的世界里,當我們談論三維線框插補時,我們在討論些什么?
或許,是如何讓一個圓柱平滑地演變為一個精致的碟狀結構;或許,是如何巧妙地將一個醒酒器無縫過渡為圓潤的花瓶;甚至,是如何從一棟帶有屋頂的建筑物,逐漸變化為簡單明朗的方形結構,以及諸如漏斗或盤狀結構之間的自由形態過渡。
聰明的 CLR-Wire (發音:Clear-Wire) 為我們提供了答案:
它創新地將幾何曲線與拓撲結構統一編碼至連續潛空間,實現了不同三維曲線框之間的平滑過渡。這不僅拓展了三維線框建模的邊界,也為三維形狀生成和交互式設計開啟了全新的想象空間。
接下來,讓我們深入探索 CLR-Wire 的關鍵技術與背后機理。
CLR-Wire 的關鍵技術與背后機理
三維曲線框作為對三維形狀的簡潔抽象表示,在形狀簡化 [Mehra et al. 2009]、曲面重建 [Pan et al. 2015] 及交互式設計 [Gal et al. 2009] 中具有重要意義。然而,早期方法多依賴高質量點云提取角點或邊緣 [Liu et al. 2021; Zhu et al. 2023],缺乏對線框的拓撲重建;最新 B-rep 生成方法如 SolidGen [Jayaraman et al. 2023]、BrepGen [Xu et al . 2024] 雖然可以建模頂點、邊、面,但主要面向規則幾何,對不規則形狀支持不足,且采用幾何與拓撲分離的建模方式,容易引入誤差。
該工作提出了 CLR-Wire,首先,通過多層交叉注意力將神經參數化曲線及其離散拓撲關系聯合編碼為定長潛向量,并借助變分自編碼器構建連續的潛空間分布; 隨后,采用流匹配方法實現從高斯噪聲到完整線框的生成,并支持無條件生成以及基于點云、圖像的條件生成。實驗結果表明,該方法在生成精度、新穎性和多樣性方面均顯著優于最先進方法,并能有效適應復雜拓撲結構,為 CAD 設計與三維內容創作提供了高效可靠的全新解決方案。
本工作圍繞三維曲線框的連續潛空間表示與生成,主要貢獻如下:
- 引入了線框的連續潛空間表示,實現了三維曲線框幾何與拓撲的平滑插值;
- 構建了基于連續潛空間的三維曲線框生成框架;
- 支持無條件及條件驅動(點云或圖像)的線框生成。
CurveVAE
CurveVAE 模塊的目標是將各類三維幾何曲線映射為緊湊的潛向量表示。首先,該方法對每條曲線進行標準化處理,通過平移使曲線起點位于固定位置,并通過旋轉和縮放對齊終點至另一固定位置,以消除不同曲線之間的位置、朝向和尺度差異,從而提升訓練穩定性。隨后,沿標準化后的曲線均勻采樣若干點,利用交叉注意力機制對高維的曲線點云進行特征降維,再通過多層一維卷積壓縮為潛向量,同時保留曲線的細節。在解碼階段,解碼器先用一維上采樣卷積恢復至較高維度的特征,再結合位置編碼與交叉注意力機制,通過多層感知機將連續參數映射回曲線上對應的位置,最終實現曲線的連續化重建。
WireframeVAE
WireframeVAE 模塊旨在將來自曲線編碼器的潛向量、對應的頂點坐標以及鄰接關系列表進行融合編碼,并把它們一起映射為一個全局潛向量。為此,該方法首先通過廣度優先遍歷的方式對鄰接列表中的線段順序進行排序,然后使用 Perceiver 聚合模塊融合曲線特征、頂點信息和拓撲連接關系,生成統一的全局潛向量。在解碼階段,該方法使用一組可學習的查詢向量對該全局潛向量進行交叉注意力操作,提取各條曲線的特征,再通過特征映射器分別預測鄰接關系、頂點坐標和曲線潛向量,從而完整重建線框結構。此外,通過構建差分形式的鄰接關系,該方法簡化了鄰接列表的表示。最后,在訓練中結合均方誤差損失、交叉熵損失和散度損失,以確保幾何信息與拓撲信息的高效融合與高質量重建。
WireframeVAE 流程圖
Flow Matching
基于線框潛在表示的 Flow Matching 模塊,旨在逐步從噪聲中生成線框樣本的潛向量表示。該方法通過訓練一個速度場網絡來描述潛向量隨時間的演化,將初始噪聲分布沿著一條概率路徑演變為目標潛在分布。網絡在訓練過程中最小化預測速度與實際變化速度之間的誤差,以學習到正確的演化場。訓練完成后,只需求解該演化過程,即可生成新的潛空間樣本。為了支持條件生成,方法還引入了預訓練的圖像特征提取模型和點云特征提取網絡,從而兼顧無條件生成和基于稀疏點云或單視圖圖像的三維線框生成。
結果展示
為了評估線框生成質量,該方法首先采用 CD 和 EMD 來度量生成線框與參考線框在幾何形狀上的相似性;隨后引入分布式指標以衡量樣本的多樣性與一致性:COV 用于評估生成結果的覆蓋率,MMD 衡量結果與真實分布的差異,1-NN 則量化兩者分布的相近程度。結合這些指標,該方法與 3Dwire [Ma et al. 2024]、DeepCAD [Wu et al. 2021] 及 BrepGen [Xu et al. 2024] 在無條件生成任務上進行了對比。
在無條件生成實驗中,3DWire 僅能生成由直線段構成的線框,無法描述曲線;DeepCAD 和 BrepGen 雖能生成帶曲面模型,但其線框多依賴于表面生成,結構簡單且缺乏細節。相比之下,CLR-Wire 通過統一的連續潛空間同時編碼幾何與拓撲,能夠直接生成完整且多樣的自由曲線框。
在 ABC 數據集上與其他方法的無條件生成結果對比
此外,通過從大量生成樣本中進行多次隨機抽樣實驗,該方法在各項評價指標上均顯著超越其他方法:更高的覆蓋率表明生成結果多樣性更強,更低的分布差異度體現了幾何一致性更好,而最近鄰評分則證明了潛空間分布與測試集高度契合,進一步驗證了該方法的建模能力和可靠性。
與其他方法的無條件生成定量指標對比結果(左) 與基于點云的線框重建方法的對比(右)
在有條件生成實驗中,該方法測試了以點云或圖像為條件的線框生成能力。針對點云條件,該方法在稀疏和局部缺失場景下,與依賴密集點云的 RFEPS [Xu et al. 2022] 和 NerVE [Zhu et al. 2023] 進行了對比。CLR-Wire 在 CD、EMD 和 F1 Score 上均優于其他方法,且生成的線框在細節和拓撲上更為完整。傳統方法依賴局部尖銳特征,面對平滑或缺失輸入易產生不完整結構,而該方法憑借預訓練的全局潛空間和幾何 — 拓撲先驗,有效彌補稀疏與不完整信息,保持重建完整性與一致性。
點云條件下不同方法的重建結果對比 (左) 該方法在部分點云條件下生成結果(右)
此外,將單視圖圖像和草圖作為條件輸入時,該方法同樣能夠生成完整且具新穎性的三維曲線框,展現出良好的跨模態生成能力和應用潛力。
該方法在單視圖與草圖條件下的生成結果
在潛空間插值實驗中,該方法實現了不同線框之間的平滑過渡。該方法首先提取不同線框對應的潛向量,然后通過球面線性插值生成中間潛在表示序列,再解碼為相應的三維曲線框。結果表明,該插值過程不僅在幾何細節上保持了高保真度,還成功捕捉了起始與目標線框之間的拓撲變化,展示了該方法在直觀編輯與交互式操作等應用場景中的潛在價值。
潛空間插值可視化:(b)–(e) 展示了不同拓撲形狀的連續過渡,其中 (e) 從瓶狀結構平滑變換到開口碗狀,體現了該方法對幾何與拓撲變化的捕捉能力
總結與展望
該方法提出了將不規則三維曲線框統一映射至連續潛空間的框架,實現了在潛空間中融合幾何細節與拓撲連接,保證了線框生成過程中的一致性與完整性。實驗驗證了該表示在潛空間插值、無條件與有條件生成方面均具備優異的多樣性與精度,顯著提升了復雜曲線框的生成能力。盡管該潛空間已展示出平滑插值的能力,但在可控生成與編輯方面仍需進一步研究。未來,仍需要將潛空間與文本描述更緊密地對齊,以實現更高層次的語義驅動控制。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.