4月23日,騰訊宣布,混元3D生成模型全新升級,v2.5新版本在建模精細(xì)度上大幅提升,3D生成邁入超高清時代。
混元3DAI創(chuàng)作引擎全面更新至v2.5模型底座,同時免費(fèi)生成額度翻倍,提升至每天20次?;煸?D生成API也已正式上線騰訊云,面向企業(yè)和開發(fā)者開放。
傳統(tǒng)3D人工建模存在耗時長、管線復(fù)雜等難點(diǎn),混元3D基于大模型技術(shù),僅需輸入圖片或文字描述,即可快速生成高質(zhì)量3D模型,極大地降低3D內(nèi)容創(chuàng)作門檻。
相比前代,混元3Dv2.5模型架構(gòu)全面升級,總參數(shù)量從1B提升至10B,有效面片數(shù)增加超10倍,實(shí)現(xiàn)超高清的幾何細(xì)節(jié)建模,表面更平整、邊緣更銳利、細(xì)節(jié)更豐富,有效幾何分辨率達(dá)到1024,就像從標(biāo)清升級到了超清畫質(zhì)。
如果說幾何模型是3D物體的“骨骼”,紋理就像3D物體的“皮膚”,決定它看起來是粗糙、光滑還是有細(xì)節(jié)?;煸?D新版本支持4K高清紋理和細(xì)粒度bump凹凸貼圖,能夠模擬物體表面高低起伏的視覺效果。同時,混元3D在業(yè)界率先實(shí)現(xiàn)多視圖輸入生成PBR模型,讓物體的光影、反射等看起來更接近現(xiàn)實(shí),顯著提升生成質(zhì)感和真實(shí)感。
多視圖PBR生成
為滿足專業(yè)創(chuàng)作者需求,混元3Dv2.5優(yōu)化了骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)下的自動骨骼綁定和自動蒙皮權(quán)重賦值,大幅提升3D動畫生成效率。
同時,3D生成工作流功能也進(jìn)一步升級,提供文生/圖生3D智能減面模型、多視圖生3D模型等專業(yè)管線模板,用戶可根據(jù)場景選擇對應(yīng)生產(chǎn)管線、靈活調(diào)整參數(shù),生成特定風(fēng)格和特征的3D資產(chǎn),助力游戲開發(fā)、動畫制作等垂直場景的高效搭建。
3DAIGC技術(shù)迭代迅速,應(yīng)用落地進(jìn)程也在不斷加快,游戲制作、社交、電商廣告、工業(yè)制造、具身智能、自動駕駛、AR/VR等多個領(lǐng)域都積極應(yīng)用AI能力輔助3D內(nèi)容生產(chǎn)。以游戲制作為例,3D管線(即將3D場景數(shù)據(jù)轉(zhuǎn)化為最終呈現(xiàn)在屏幕上的2D圖像)是最為核心的環(huán)節(jié)之一,但同時也最考驗(yàn)時間和資金成本。騰訊混元3D創(chuàng)作引擎通過技術(shù)創(chuàng)新與場景應(yīng)用的雙向驅(qū)動,用AI技術(shù)重構(gòu)3D生產(chǎn)管線,推動3D內(nèi)容創(chuàng)作向普惠化與專業(yè)化并重邁進(jìn)。
據(jù)了解,騰訊混元積極擁抱開源生態(tài),混元3D1.0、2.0基礎(chǔ)模型及基于2.0模型的加速、多視圖和輕量級模型均已開源,Github總star數(shù)超1.2萬,不斷豐富3DAIGC社區(qū)。
騰訊混元在大語言模型和多模態(tài)大模型方面布局全面,混元視頻生成、DiT文生圖及千億參數(shù)MoE語言模型等領(lǐng)先模型均已對外開源,GitHub總Star數(shù)超2.9萬,多次登頂HuggingFace趨勢榜,近期火爆AI圈的視頻開源項(xiàng)目FramePack,也選擇混元視頻開源模型作為基模進(jìn)一步優(yōu)化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.