99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Large Avatar Model:單圖打造寫實3D交互數字人,跨平臺驅動渲染

0
分享至



論文作者來自阿里巴巴通義實驗室的 3D 團隊。第一作者何益升,本科畢業于武漢大學,博士畢業于香港科技大學;通訊作者原瑋浩,本科畢業于浙江大學,博士畢業于香港科技大學;團隊 Leader 董子龍,本科博士均畢業于浙江大學。

三維數字頭像的建模、驅動和渲染是計算機圖形學與計算機視覺的重要課題之一,在虛擬會議、影視制作、游戲開發等領域有廣泛應用。傳統方法依賴多視角數據或視頻序列訓練,存在計算成本高、輸入條件難、泛化能力弱等問題。

近年來,基于神經輻射場(NeRF)和 3D 高斯濺射(Gaussian Splatting)的技術雖提升了建模質量,但仍面臨多視角/視頻輸入訓練的依賴以及神經后處理導致的渲染效率低的問題。

LAM(Large Avatar Model)的提出,旨在通過單張圖像實現實時可驅動的 3D 高斯頭像生成,突破傳統方法對視頻數據或復雜后處理的依賴,為輕量化、跨平臺的 3D 數字人應用提供新思路。



  • 論文標題:LAM:Large Avatar Model for One-shot Animatable Gaussian Head
  • 論文地址:https://arxiv.org/abs/2502.17796
  • 項目主頁: https://aigc3d.github.io/projects/LAM
  • 代碼庫:https://github.com/aigc3d/LAM
  • 國外 Demo:https://huggingface.co/spaces/3DAIGC/LAM
  • 國內 Demo:https://www.modelscope.cn/studios/Damo_XR_Lab/LAM_Large_Avatar_Model



核心亮點:

單圖秒級生成超寫實 3D 數字人

WebGL 跨平臺超實時驅動渲染,手機跑滿 120FPS

低延遲實時交互對話數字人 SDK 已全開源

方法

LAM 的核心目標是:單圖輸入、一次前向傳播生成可驅動的 3D 高斯頭像,無需后處理網絡,并兼容傳統圖形渲染管線實現跨平臺實時渲染。其技術框架圍繞以下核心突破展開:



規范化空間的三維高斯球生成

  • 人頭模型先驗引導:LAM 基于 FLAME 頭部模板的頂點來初始化高斯球位置,結合形狀混合形變(Blendshapes)與骨骼線性蒙皮(LBS)的驅動機制,將三維頭像的生成置于規范化空間(Canonical Space),統一不同表情與姿態的幾何表達,降低生成復雜度。

  • 多模態特征交互 Transformer:LAM 利用預訓練的 DinoV2 提取輸入圖像的多層級特征,通過堆疊式交叉注意力模塊(Cross-Attention)讓 3D 空間中的點特征與 2D 空間中的圖像特征進行交互,預測 3D 高斯球的位置、顏色、透明度等屬性,并引入形變偏移(Offset)優化人頭的幾何形狀(如頭發、飾品等)。

  • 細分網格增強細節:FLAME 原始頂點數只有 5023 個,表達能力有限,LAM 通過網格細分算法(Mesh Subdivision)增加點密度(默認兩次細分達 81424 點),從而提升頭發、胡須等細節的建模能力。使用不同的細分程度,也可以在模型生成質量與渲染速度之間進行平衡。

無需神經后處理的驅動與渲染

  • 傳統動畫驅動機制直接遷移:生成的規范空間中的 3D 高斯人頭,可直接使用骨骼線性混合蒙皮(LBS)與形狀混合形變(Blendshapes)參數,驅動表情與姿態變化,無需額外神經網絡參與動畫或渲染計算,達到超實時的渲染效率。

  • 海量視頻數據訓練:傳統 3D 數字人的訓練數據要求苛刻,有時甚至需要多視角視頻數據,難以 scale up,而 LAM 的模型架構使其可以在普通的單目視頻上進行訓練,從而可以很輕易地 scale up。在模型訓練中,一段視頻中取任意一幀作為輸入圖片,生成 3D 高斯人頭,然后基于視頻檢測得到的頭部姿態和面部表情,渲染不同幀的圖片,與真值之間求損失來優化生成網絡。

跨平臺超實時渲染架構

  • 輕量化 3D 高斯表達:LAM 的驅動和渲染沒有任何神經網絡的參與,是直接使用傳統動畫驅動 + 三維高斯濺射渲染,因此可以直接兼容傳統圖形管線。

  • WebGL 渲染:LAM 基于 WebGL 實現了表情、動作驅動和三維高斯濺射的渲染,天然支持跨平臺的特性,可以在不同設備如電腦、手機、電視、大屏等設備上進行直接驅動和渲染,效率達到超實時,如 8W 點模型可以在 Macbook 上輕松跑滿屏幕上限 120FPS,2W 點模型甚至能在移動端跑到 120FPS。



實驗

定量結果

論文在 VFHQ(高分辨率視頻人臉數據集)與 HDTF(高清對話視頻數據集)上驗證 LAM 性能,對比對象包括 NeRF 方法及 3D 高斯濺射方法,指標涵蓋重建質量、身份一致性、動畫精度與渲染效率。



從結果來看,LAM 以超寫實的圖像質量刷新記錄,以無神經網絡的超輕量模型擊敗之前的重網絡模型。

更多應用

LAM 不僅限于單圖生成,也可以結合圖像大模型進行實現跨模態藝術創作:

  • 文本驅動生成

結合文生圖模型,用戶輸入提示詞(如「戴帽子的卡通男性」)生成任意風格的人頭圖像,LAM 可以直接轉換為可驅動三維高斯模型。如圖所示,生成的頭像可準確保留提示中的服飾元素(帽子)與藝術風格(卡通化):



  • 3D 風格遷移

通過圖像編輯模型對輸入圖像進行年齡、妝容等編輯,LAM 可以同步更新高斯屬性。例如將真人頭像轉化為油畫風格時,模型保留幾何結構僅調整顏色與紋理等:



交互對話數字人解決方案

以 LAM 為基礎,通義實驗室構建了完整的智能交互對話數字人解決方案,融合通義千問大語言模型、通義語音算法、通義數字人驅動算法,構建成熟、魯棒的完整工程方案,實現輕量化、低成本、低延遲、跨平臺的端側渲染,支持智能客服、情感陪伴、教育培訓等產品。

目前,完整的解決方案均已開源,包括整個鏈路中的各個模塊。即使用開源的代碼庫,就可以實現輸入一張圖片,生成超寫實 3D 數字人,進行實時的對話聊天。


https://mp.weixin.qq.com/s/41mpwUeWFARsXRWuDrCBZA

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
最新!那小姐有了新消息

最新!那小姐有了新消息

亞哥談古論今
2025-06-21 19:02:13
剛剛!房貸利率低至2.6%!央行公布6月最新LPR!

剛剛!房貸利率低至2.6%!央行公布6月最新LPR!

錘不倒的拖油瓶
2025-06-21 09:01:50
河南一商人稱遭民警逼迫簽下1200萬元調解協議后被羈押8個月,申請國賠近18萬元,檢方已受理

河南一商人稱遭民警逼迫簽下1200萬元調解協議后被羈押8個月,申請國賠近18萬元,檢方已受理

大風新聞
2025-06-21 17:20:08
中甲積分榜:重慶銅梁龍遭賽季首敗,落后榜首遼寧鐵人2分

中甲積分榜:重慶銅梁龍遭賽季首敗,落后榜首遼寧鐵人2分

雷速體育
2025-06-21 21:47:26
明日花綺羅火到了中國,她否認與周鶴年有性交易,網友熱議未停息

明日花綺羅火到了中國,她否認與周鶴年有性交易,網友熱議未停息

快樂娛文
2025-06-21 11:47:49
北大人民醫院副院長答紅星新聞:晚期肺癌患者生存期已顯著延長,甚至接近慢病化

北大人民醫院副院長答紅星新聞:晚期肺癌患者生存期已顯著延長,甚至接近慢病化

紅星新聞
2025-06-20 18:11:36
巴黎站100米欄冠軍12秒21前八均達標東京 林雨薇:重心放在全運會

巴黎站100米欄冠軍12秒21前八均達標東京 林雨薇:重心放在全運會

勁爆體壇
2025-06-21 12:25:13
“任何侵犯中國領空的外國飛機,直接擊落!”中國通報全球

“任何侵犯中國領空的外國飛機,直接擊落!”中國通報全球

文雅筆墨
2025-06-20 13:06:53
以媒曝飛行追蹤數據:兩架B-2轟炸機從美國本土起飛 飛往關島美軍基地

以媒曝飛行追蹤數據:兩架B-2轟炸機從美國本土起飛 飛往關島美軍基地

財聯社
2025-06-21 19:01:32
全紅嬋調侃郭晶晶:想不想來我老家摘荔枝?郭晶晶回應讓人笑翻

全紅嬋調侃郭晶晶:想不想來我老家摘荔枝?郭晶晶回應讓人笑翻

娛最資訊
2025-06-20 17:49:10
伊朗亮出滅國威脅,以色列人被嚇哭,前國王鼓動百萬大軍揭竿而起

伊朗亮出滅國威脅,以色列人被嚇哭,前國王鼓動百萬大軍揭竿而起

大白話瞰世界
2025-06-21 11:28:19
福建一姑娘把“荔枝核”泡水里,兩周長成“粉盆栽”,太治愈了

福建一姑娘把“荔枝核”泡水里,兩周長成“粉盆栽”,太治愈了

美家指南
2025-06-09 11:08:50
網傳鳳姐可能要被遣返?這名網紅鼻祖曾持特殊簽證留美,未獲綠卡

網傳鳳姐可能要被遣返?這名網紅鼻祖曾持特殊簽證留美,未獲綠卡

火山詩話
2025-06-21 06:42:47
好的信號?楊瀚森的父母已經啟程前往美國 現場支持兒子

好的信號?楊瀚森的父母已經啟程前往美國 現場支持兒子

直播吧
2025-06-21 17:17:23
又美又能打!中國女籃鋒線悍將,15分鐘砍11分,完全頂替了李夢

又美又能打!中國女籃鋒線悍將,15分鐘砍11分,完全頂替了李夢

體育哲人
2025-06-21 17:04:57
可能要見證歷史,美軍大規模調兵備戰,中方:所有中國人快撤

可能要見證歷史,美軍大規模調兵備戰,中方:所有中國人快撤

劉振起觀點
2025-06-20 15:04:44
李嘉誠再次給出神預測!不出5年,90%的家庭恐難逃這5大現實難題

李嘉誠再次給出神預測!不出5年,90%的家庭恐難逃這5大現實難題

詩詞中國
2025-06-18 13:14:10
全面戰爭爆發前,北京2次撥號,以色列掛了王毅電話后,再炸第2國

全面戰爭爆發前,北京2次撥號,以色列掛了王毅電話后,再炸第2國

大白話瞰世界
2025-06-17 13:35:57
24歲男子口腔及生殖器反復潰瘍,視力下降,罕見病?

24歲男子口腔及生殖器反復潰瘍,視力下降,罕見病?

醫脈通
2025-06-20 20:10:14
新老板上任!湖人大清洗!8年老員工被開,詹姆斯欣慰第五冠有望

新老板上任!湖人大清洗!8年老員工被開,詹姆斯欣慰第五冠有望

阿泰希特
2025-06-21 11:34:18
2025-06-21 23:52:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10687文章數 142343關注度
往期回顧 全部

科技要聞

Siri有救了?蘋果被曝正討論史上最大收購

頭條要聞

官方通報那爾那茜有關情況:涉嫌高考報名材料造假

頭條要聞

官方通報那爾那茜有關情況:涉嫌高考報名材料造假

體育要聞

王欣瑜:資格賽差點要退賽 夢幻般的一周

娛樂要聞

離婚7年,楊冪逆襲碾壓劉愷威

財經要聞

租金大撤退!房東正在批量跑路!

汽車要聞

扔掉"舊地圖”一汽-大眾大眾品牌要找"新大陸"

態度原創

手機
家居
時尚
房產
本地

手機要聞

曝REDMI K90系列影像新升級:評估豪威OV50Q主攝

家居要聞

山水之間 墨染風雨云間

天啊,凱特王妃都在準備葬禮了?

房產要聞

坑慘2000多人!恒大財富海南高管被曝非吸12.6億元!

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 克东县| 澜沧| 焉耆| 留坝县| 九台市| 互助| 新乐市| 阿坝| 武川县| 正安县| 清苑县| 泰宁县| 廉江市| 金昌市| 报价| 原阳县| 山东| 新宾| 凤凰县| 沂源县| 上杭县| 济源市| 灵宝市| 枞阳县| 上虞市| 庄河市| 安国市| 合川市| 周口市| 正蓝旗| 巴林左旗| 巴青县| 博白县| 呈贡县| 遵义县| 茶陵县| 成安县| 青龙| 深圳市| 巴彦淖尔市| 宣化县|