- 克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
就在剛剛的CVPR上,鵝廠3D生成模型混元3D 2.1正式宣布開源!
它可以緊跟潮流,細膩地呈現出當紅炸子雞Labubu。
也可以走復古路線,生成紋理精致的青銅器。
總之相比于前一代2.0,混元3D 2.1主打的是幾何與紋理的雙重優化。
特別在紋理貼面上有比較大的優化,可達到當前開源3D模型中的SOTA。
比如這個金屬質地的葡萄型擺件,2.1和之前2.0的質感和光澤對比非常明顯:
并且混元3D 2.1的訓練代碼、模型權重、數據處理流程全部開源,支持一鍵部署,開發者還可以自主精調。
據騰訊介紹,這是首個全鏈路開源的工業級3D生成大模型,并且達到了閉源級水平,同時還可適配消費級顯卡。
主打幾何與紋理雙優化
如開頭所述,混元3D 2.1主打的是幾何與紋理的雙重優化。
幾何決定了建立出的模型在形狀上的精度,紋理則還原模型表面的顏色、光澤和細節表現。
混元3D 2.1 可生成基礎顏色、金屬度、粗糙度等指標各不相同的貼圖,同時還支持皮革、木質、金屬、陶瓷等多種復雜材質的高質量渲染。
比如這組青花瓷制成的小船,可以看到右側2.1版本生成的結果光澤更好,底座的紋路也更加細膩,釉面上的青花圖案分布也更為合理。
對于同樣的物體,搭配不同的材質就能呈現出不一樣的效果,比如下面的金屬老虎和玉雕老虎,都栩栩如生。
還可以在同一個模型中呈現不同的質感,比如這組“吹號角的僧人”當中,不僅可以看到人臉上的皺紋更加清晰,還能看到號角的金屬感更強。
衣服沒有了過度的反光,衣襟的圖案也更清晰,甚至手中杯里的水看上去也更加自然了。
模型的細節和圖案的復雜程度,也可以精致到手辦級別。
技術層面,在混元3D 2.0的基礎上,混元3D 2.1模型進一步強化了“幾何-紋理解耦”架構。
基于DiT幾何架構,混元3D 2.1優化了細節建模,使網格精度更高,具備更好的形狀一致性,以便更好進行后續的紋理映。
同時,混元在3D開源模型中引入PBR(基于物理的渲染)紋理生成技術。相較傳統RGB貼圖技術,PBR通過模擬光線與材質的物理交互,提升模型在不同光照環境下的視覺一致性。
相比于TexGen等其他模型,以及混元3D之前的2.0版本,新版混元3D模型的材質還原能力均達到了最佳水平。
在用戶盲測中,混元3D 2.1的PBR紋理相較于RGB貼圖,質感勝出率高達78%。
另外,PBR材質的標準化特性也使其兼容主流渲染引擎(如Unreal Engine、Unity),更加容易在其他平臺中復用。
模型代碼數據全部開源
混元3D 2.1提供了模型權重、訓練代碼和數據處理流程的全鏈路開源,開發者可以自由微調、二次訓練或優化。
配置方面,混元3D 2.1適配于消費級顯卡,并且提供了詳細部署和使用教程,開發者可以輕松上手。
2024年11月,騰訊混元發布并開源了首代3D生成模型以來,今年1月,混元3D 2.0在文本一致性與幾何精度上超越了主流模型。
開源以來,混元3D模型在Hugging Face平臺下載量已超過180萬,受到了全球開發者的認可。
現在的2.1版本,進一步提升了3D模型的質感,讓AI生成的3D模型離“真實”又近了一步。
正如騰訊混元3D負責人郭春超所說:
- 混元3D 2.1的全面開源是一個新起點,期待與全球開發者、創作者及研究者攜手,共同打造更加繁榮的3D開源生態。
另外,本周日(6月15日)中午11點還將有一場題為“玩轉混元3D 2.1”的直播,感興趣的話可以到騰訊混元視頻號觀看~
項目地址:https://3d-models.hunyuan.tencent.com/
體驗地址:https://3d.hunyuan.tencent.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.