網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

騰訊混元：以開源構(gòu)建生態(tài)矩陣

2025-04-22 17:19:44　來源: 商學院雜志

北京舉報

分享至

騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù)，再構(gòu)建生態(tài)矩陣，最終實現(xiàn)商業(yè)化閉環(huán)”的理念。

文｜胡嘉琦

ID | BMR2004

近日，騰訊公布了2024年第四季度及全年財報，其2024年的研發(fā)支出創(chuàng)下707億元的歷史新高。

騰訊雄厚的資金投入正在加速其AI戰(zhàn)略進程。通過利用“自研+開源 ”的混元大模型策略，這家科技巨頭正在推動整個業(yè)務的變革性改進。

騰訊董事會主席兼首席執(zhí)行官馬化騰表示：“幾個月前，我們重組了人工智能團隊，專注于快速產(chǎn)品創(chuàng)新和深度模型開發(fā)。通過增加與人工智能相關的資本支出，并加大力度開發(fā)和營銷人工智能原生產(chǎn)品，我們正在為實現(xiàn)可持續(xù)增長做好準備。這些投資有望提高廣告效率，延長我們游戲產(chǎn)品的生命周期，而人工智能服務的不斷普及也將創(chuàng)造持久價值。”

騰訊方面向《商學院》記者表示，騰訊混元大模型已在 700 多個內(nèi)部場景中部署，促進了多個業(yè)務領域的增長。同時，騰訊積極整合前沿開源生態(tài)系統(tǒng)，騰訊混元大模型全面開源。

自主研發(fā)的通用大模型

中國大模型技術(shù)首次在多模態(tài)領域?qū)崿F(xiàn)完整開源布局。

騰訊方面向記者表示，騰訊混元大模型是騰訊自主研發(fā)的通用大模型，作為國內(nèi)首個采用MoE架構(gòu)的萬億參數(shù)大模型，通過動態(tài)路由機制實現(xiàn)計算資源優(yōu)化；通用任務調(diào)用3—5個專家模塊，專業(yè)任務激活“15+”模塊；推理效率較密集架構(gòu)提升3倍，訓練成本降低40%。

騰訊混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多個版本，同時在專屬模型上開放代碼生成、角色扮演、Functioncall（功能調(diào)用）等功能，使企業(yè)客戶與個人開發(fā)者能夠通過騰訊云實現(xiàn)API（應用程序接口）直接調(diào)用，實現(xiàn)便捷的智能化升級，目前已接入700余個騰訊業(yè)務和場景（如騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等）及騰訊旗下協(xié)作 SaaS （軟件即服務）產(chǎn)品。

自2024年全面開源以來，混元大模型覆蓋文本、圖像、視頻和3D生成等多模態(tài)。在GitHub上總Stars數(shù)超2.3w，多次登頂趨勢榜，其中混元視頻生成模型2024年12月在Hugging Face登頂且GitHub Stars超8.5k，社區(qū)開發(fā)者自發(fā)改進衍生版本逾900個，而混元DiT文生圖模型的衍生模型數(shù)量更達1600余個。

記者了解到，近日，騰訊混元大模型旗下最新發(fā)布的Hunyuan3D-2.0系列開源模型，迎來了五款產(chǎn)品（Turbo、Pro、Standard、Lite、Vision）的全系列開源，構(gòu)建起完整的工具鏈體系，標志著中國大模型技術(shù)首次在多模態(tài)領域?qū)崿F(xiàn)完整開源布局。從30秒生成高精度3D資產(chǎn)的開源框架，到覆蓋文本、圖像、視頻的全模態(tài)開源體系，騰訊混元大模型正以開放姿態(tài)引領一場全球范圍內(nèi)的數(shù)字創(chuàng)作革命。

這一突破得益于騰訊自主研發(fā)的3D生成加速框架FlashVDM，它打破了傳統(tǒng)3D生成模型的效率瓶頸，將大規(guī)模3D模型的生成時間壓縮至秒級，為開源社區(qū)與工業(yè)界的應用部署提供了可能。

Hunyuan3D-2.0推出了多種模型版本，以適應不同應用需求。例如，多視圖版本Hunyuan3D-2-MV能夠結(jié)合2—4張標準視角圖片，捕捉豐富的細節(jié)，優(yōu)化3D生成模型產(chǎn)生的效果。與此同時，mini系列模型通過架構(gòu)優(yōu)化與算力提升，降低了硬件要求，可在NVIDIA 4080顯卡甚至蘋果M1 Pro芯片上運行，使3D模型的應用更為廣泛。

騰訊自2024年11月發(fā)布第一代3D生成大模型以來，持續(xù)推動行業(yè)創(chuàng)新。如今Hunyuan3D-2.0在文本一致性、幾何精度和畫面質(zhì)量等多項評測中超越業(yè)內(nèi)頂級大模型。伴隨模型升級，面向創(chuàng)作者的騰訊混元3D AI創(chuàng)作引擎同步優(yōu)化，為游戲制作、3D UGC創(chuàng)作等提供更高效的生產(chǎn)工具。

打造生態(tài)矩陣

騰訊混元大模型實現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新，通過基礎模型開源吸引開發(fā)者。

隨著模型參數(shù)規(guī)模的增長進入瓶頸期，掌控開發(fā)者生態(tài)成為模型的新“護城河”。混元開源模型覆蓋文本、圖像、視頻、3D四大模態(tài)，構(gòu)建了一個難以復制的生態(tài)矩陣。

Hunyuan3D-2.0的發(fā)布，騰訊正加速推動3D內(nèi)容生成技術(shù)的應用落地，為創(chuàng)作者與行業(yè)用戶帶來更加智能高效的3D生產(chǎn)工具。

目前，騰訊混元3D生成模型已在多個業(yè)務場景落地，包括用戶生成內(nèi)容（UGC）、商品素材合成、游戲3D資產(chǎn)生成等。在游戲領域，Hunyuan3D-2.0生成的3D模型已達到行業(yè)標準，具備合理的幾何布線、精準的貼圖及骨骼蒙皮適配能力，為3D資產(chǎn)生產(chǎn)提供了高效、低成本的新方案。

當下，騰訊混元大模型實現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新，通過基礎模型開源吸引開發(fā)者，云端API按調(diào)用量收費，實現(xiàn)分層變現(xiàn)；與英偉達合作優(yōu)化Hunyuan3D在A100顯卡上的性能，帶動云服務銷售，實現(xiàn)硬件協(xié)同；開發(fā)者貢獻的改進代碼經(jīng)審核后整合進商業(yè)版本，形成技術(shù)升級閉環(huán)，從而實現(xiàn)數(shù)據(jù)反哺。

以騰訊元寶為例，這款應用的日活躍用戶在2025年2月至3月期間激增了20多倍。自2023年首次推出以來，騰訊混元大模型經(jīng)歷了快速迭代升級。最新版本被稱為“騰訊混元大模型 Turbo S”，可將初始響應延遲降低44%，目前已在騰訊元寶等多個內(nèi)部產(chǎn)品中使用。

開源意味著要持續(xù)不斷的更新迭代。比如騰訊元寶自上線以來，已經(jīng)歷了多次更新。騰訊方面向記者表示，2月13日，騰訊元寶集成了完整版的DeepSeek-R1，支持騰訊混元和DeepSeek模型；2月19日，騰訊元寶逐步引入并全面部署混元T1深度思維模型；2月21日，DeepSeek和混元模型升級，可理解圖像內(nèi)容；2月25日，騰訊元寶發(fā)布一鍵導出長圖功能；3月1日，騰訊元寶桌面版正式發(fā)布，同時發(fā)布的還有混元Turbo S模型的測試版。3月7日到3月13日期間，騰訊元寶推出更多增強功能，包括傳輸對話鏈接、大字體模式、拖拽上傳文件、發(fā)布并支持騰訊文檔等；3月18日，騰訊元寶此次更新整合了這些改進，增加了截圖請求、拖拽上傳文件、可調(diào)字體和暗色模式。騰訊表示將繼續(xù)改進元寶的功能，并計劃在不久的將來推出更多人性化功能。

此外，騰訊云服務、騰訊會議、騰訊文檔等生產(chǎn)力工具也正在經(jīng)歷一場人工智能驅(qū)動的重大變革。騰訊會議的人工智能助理、智能錄音、實時多語言翻譯等新功能已吸引了1500萬月活躍用戶。

目前，騰訊云通過“騰訊混元大數(shù)據(jù)+開源模式”的雙輪驅(qū)動策略，已構(gòu)建覆蓋政務、教育、醫(yī)療、金融、媒體、移動、文旅等30多個行業(yè)的多模態(tài)解決方案體系。這一舉措為深圳寶安區(qū)政府、深圳醫(yī)保、上海徐匯城市運營中心、上海文廣新聞傳媒集團、深圳大學、瑞金醫(yī)院、上海醫(yī)藥、榮譽、重慶農(nóng)村商業(yè)銀行等客戶帶來了創(chuàng)新和效率的提升。

例如，深圳寶安政務大模型率先整合“騰訊混元+DeepSeek”雙模型能力與私有化部署的寶安區(qū)專屬知識庫，構(gòu)建了“1+1+1>3”的應用效果。

如今，寶安政務知識庫現(xiàn)已覆蓋 14 個區(qū)和 20 個行業(yè)，擁有超過 30000 條政府服務記錄。此外，知識庫還包含 60 余項人工智能基礎能力，可快速部署公共服務查詢、企業(yè)支持、行政工作流、社會管理等 31 個業(yè)務場景的智能應用。

在醫(yī)療領域，騰訊與明德醫(yī)療合作開發(fā)了全球首個針對重癥監(jiān)護病房的人工智能醫(yī)療模型，名為啟元重癥大模型，目前已在國內(nèi)部分醫(yī)院進行臨床試驗。

騰訊混元大模型全系開源備受業(yè)內(nèi)關注。科方得智庫研究負責人張新原在接受《商學院》記者采訪時，以辯證視角肯定了該模型的開源策略，認為其憑借強大的語言理解與生成能力、對海量文本數(shù)據(jù)的處理能力以及廣泛的應用場景，在自然語言處理、機器學習、人工智能等領域表現(xiàn)出色；此外，其萬億級參數(shù)規(guī)模不僅提升了模型的計算和泛化能力，還賦予了極高的靈活性和可擴展性，使其能夠針對不同需求進行優(yōu)化。與此同時，該模型在訓練和部署上存在成本高、調(diào)試優(yōu)化難度大以及潛在缺陷等問題，需要更多測試和驗證來保障穩(wěn)定性。

中關村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥認為，騰訊混元在中文創(chuàng)作、邏輯推理和任務執(zhí)行方面有優(yōu)勢，并強調(diào)通過開源可以降低技術(shù)門檻，促進企業(yè)和開發(fā)者的二次開發(fā)與技術(shù)合作，從而進一步推動技術(shù)進步和行業(yè)發(fā)展。

騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù)，再構(gòu)建生態(tài)矩陣，最終實現(xiàn)商業(yè)化閉環(huán)”的理念，對于騰訊未來能否實現(xiàn)商業(yè)化落地，《商學院》記者將持續(xù)關注。

來源 | 2025年4月刊

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.