騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù),再構(gòu)建生態(tài)矩陣,最終實現(xiàn)商業(yè)化閉環(huán)”的理念。
文|胡嘉琦
ID | BMR2004
近日,騰訊公布了2024年第四季度及全年財報,其2024年的研發(fā)支出創(chuàng)下707億元的歷史新高。
騰訊雄厚的資金投入正在加速其AI戰(zhàn)略進程。通過利用“自研+開源 ”的混元大模型策略,這家科技巨頭正在推動整個業(yè)務的變革性改進。
騰訊董事會主席兼首席執(zhí)行官馬化騰表示:“幾個月前,我們重組了人工智能團隊,專注于快速產(chǎn)品創(chuàng)新和深度模型開發(fā)。通過增加與人工智能相關的資本支出,并加大力度開發(fā)和營銷人工智能原生產(chǎn)品,我們正在為實現(xiàn)可持續(xù)增長做好準備。這些投資有望提高廣告效率,延長我們游戲產(chǎn)品的生命周期,而人工智能服務的不斷普及也將創(chuàng)造持久價值。”
騰訊方面向《商學院》記者表示,騰訊混元大模型已在 700 多個內(nèi)部場景中部署,促進了多個業(yè)務領域的增長。同時,騰訊積極整合前沿開源生態(tài)系統(tǒng),騰訊混元大模型全面開源。
01
自主研發(fā)的通用大模型
中國大模型技術(shù)首次在多模態(tài)領域?qū)崿F(xiàn)完整開源布局。
騰訊方面向記者表示,騰訊混元大模型是騰訊自主研發(fā)的通用大模型,作為國內(nèi)首個采用MoE架構(gòu)的萬億參數(shù)大模型,通過動態(tài)路由機制實現(xiàn)計算資源優(yōu)化;通用任務調(diào)用3—5個專家模塊,專業(yè)任務激活“15+”模塊;推理效率較密集架構(gòu)提升3倍,訓練成本降低40%。
騰訊混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多個版本,同時在專屬模型上開放代碼生成、角色扮演、Functioncall(功能調(diào)用)等功能,使企業(yè)客戶與個人開發(fā)者能夠通過騰訊云實現(xiàn)API(應用程序接口)直接調(diào)用,實現(xiàn)便捷的智能化升級,目前已接入700余個騰訊業(yè)務和場景(如騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等)及騰訊旗下協(xié)作 SaaS (軟件即服務)產(chǎn)品。
自2024年全面開源以來,混元大模型覆蓋文本、圖像、視頻和3D生成等多模態(tài)。在GitHub上總Stars數(shù)超2.3w,多次登頂趨勢榜,其中混元視頻生成模型2024年12月在Hugging Face登頂且GitHub Stars超8.5k,社區(qū)開發(fā)者自發(fā)改進衍生版本逾900個,而混元DiT文生圖模型的衍生模型數(shù)量更達1600余個。
記者了解到,近日,騰訊混元大模型旗下最新發(fā)布的Hunyuan3D-2.0系列開源模型,迎來了五款產(chǎn)品(Turbo、Pro、Standard、Lite、Vision)的全系列開源,構(gòu)建起完整的工具鏈體系,標志著中國大模型技術(shù)首次在多模態(tài)領域?qū)崿F(xiàn)完整開源布局。從30秒生成高精度3D資產(chǎn)的開源框架,到覆蓋文本、圖像、視頻的全模態(tài)開源體系,騰訊混元大模型正以開放姿態(tài)引領一場全球范圍內(nèi)的數(shù)字創(chuàng)作革命。
這一突破得益于騰訊自主研發(fā)的3D生成加速框架FlashVDM,它打破了傳統(tǒng)3D生成模型的效率瓶頸,將大規(guī)模3D模型的生成時間壓縮至秒級,為開源社區(qū)與工業(yè)界的應用部署提供了可能。
Hunyuan3D-2.0推出了多種模型版本,以適應不同應用需求。例如,多視圖版本Hunyuan3D-2-MV能夠結(jié)合2—4張標準視角圖片,捕捉豐富的細節(jié),優(yōu)化3D生成模型產(chǎn)生的效果。與此同時,mini系列模型通過架構(gòu)優(yōu)化與算力提升,降低了硬件要求,可在NVIDIA 4080顯卡甚至蘋果M1 Pro芯片上運行,使3D模型的應用更為廣泛。
騰訊自2024年11月發(fā)布第一代3D生成大模型以來,持續(xù)推動行業(yè)創(chuàng)新。如今Hunyuan3D-2.0在文本一致性、幾何精度和畫面質(zhì)量等多項評測中超越業(yè)內(nèi)頂級大模型。伴隨模型升級,面向創(chuàng)作者的騰訊混元3D AI創(chuàng)作引擎同步優(yōu)化,為游戲制作、3D UGC創(chuàng)作等提供更高效的生產(chǎn)工具。
02
打造生態(tài)矩陣
騰訊混元大模型實現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新,通過基礎模型開源吸引開發(fā)者。
隨著模型參數(shù)規(guī)模的增長進入瓶頸期,掌控開發(fā)者生態(tài)成為模型的新“護城河”。混元開源模型覆蓋文本、圖像、視頻、3D四大模態(tài),構(gòu)建了一個難以復制的生態(tài)矩陣。
Hunyuan3D-2.0的發(fā)布,騰訊正加速推動3D內(nèi)容生成技術(shù)的應用落地,為創(chuàng)作者與行業(yè)用戶帶來更加智能高效的3D生產(chǎn)工具。
目前,騰訊混元3D生成模型已在多個業(yè)務場景落地,包括用戶生成內(nèi)容(UGC)、商品素材合成、游戲3D資產(chǎn)生成等。在游戲領域,Hunyuan3D-2.0生成的3D模型已達到行業(yè)標準,具備合理的幾何布線、精準的貼圖及骨骼蒙皮適配能力,為3D資產(chǎn)生產(chǎn)提供了高效、低成本的新方案。
當下,騰訊混元大模型實現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新,通過基礎模型開源吸引開發(fā)者,云端API按調(diào)用量收費,實現(xiàn)分層變現(xiàn);與英偉達合作優(yōu)化Hunyuan3D在A100顯卡上的性能,帶動云服務銷售,實現(xiàn)硬件協(xié)同;開發(fā)者貢獻的改進代碼經(jīng)審核后整合進商業(yè)版本,形成技術(shù)升級閉環(huán),從而實現(xiàn)數(shù)據(jù)反哺。
以騰訊元寶為例,這款應用的日活躍用戶在2025年2月至3月期間激增了20多倍。自2023年首次推出以來,騰訊混元大模型經(jīng)歷了快速迭代升級。最新版本被稱為“騰訊混元大模型 Turbo S”,可將初始響應延遲降低44%,目前已在騰訊元寶等多個內(nèi)部產(chǎn)品中使用。
開源意味著要持續(xù)不斷的更新迭代。比如騰訊元寶自上線以來,已經(jīng)歷了多次更新。騰訊方面向記者表示,2月13日,騰訊元寶集成了完整版的DeepSeek-R1,支持騰訊混元和DeepSeek模型;2月19日,騰訊元寶逐步引入并全面部署混元T1深度思維模型;2月21日,DeepSeek和混元模型升級,可理解圖像內(nèi)容;2月25日,騰訊元寶發(fā)布一鍵導出長圖功能;3月1日,騰訊元寶桌面版正式發(fā)布,同時發(fā)布的還有混元Turbo S模型的測試版。3月7日到3月13日期間,騰訊元寶推出更多增強功能,包括傳輸對話鏈接、大字體模式、拖拽上傳文件、發(fā)布并支持騰訊文檔等;3月18日,騰訊元寶此次更新整合了這些改進,增加了截圖請求、拖拽上傳文件、可調(diào)字體和暗色模式。騰訊表示將繼續(xù)改進元寶的功能,并計劃在不久的將來推出更多人性化功能。
此外,騰訊云服務、騰訊會議、騰訊文檔等生產(chǎn)力工具也正在經(jīng)歷一場人工智能驅(qū)動的重大變革。騰訊會議的人工智能助理、智能錄音、實時多語言翻譯等新功能已吸引了1500萬月活躍用戶。
目前,騰訊云通過“騰訊混元大數(shù)據(jù)+開源模式”的雙輪驅(qū)動策略,已構(gòu)建覆蓋政務、教育、醫(yī)療、金融、媒體、移動、文旅等30多個行業(yè)的多模態(tài)解決方案體系。這一舉措為深圳寶安區(qū)政府、深圳醫(yī)保、上海徐匯城市運營中心、上海文廣新聞傳媒集團、深圳大學、瑞金醫(yī)院、上海醫(yī)藥、榮譽、重慶農(nóng)村商業(yè)銀行等客戶帶來了創(chuàng)新和效率的提升。
例如,深圳寶安政務大模型率先整合“騰訊混元+DeepSeek”雙模型能力與私有化部署的寶安區(qū)專屬知識庫,構(gòu)建了“1+1+1>3”的應用效果。
如今,寶安政務知識庫現(xiàn)已覆蓋 14 個區(qū)和 20 個行業(yè),擁有超過 30000 條政府服務記錄。此外,知識庫還包含 60 余項人工智能基礎能力,可快速部署公共服務查詢、企業(yè)支持、行政工作流、社會管理等 31 個業(yè)務場景的智能應用。
在醫(yī)療領域,騰訊與明德醫(yī)療合作開發(fā)了全球首個針對重癥監(jiān)護病房的人工智能醫(yī)療模型,名為啟元重癥大模型,目前已在國內(nèi)部分醫(yī)院進行臨床試驗。
騰訊混元大模型全系開源備受業(yè)內(nèi)關注。科方得智庫研究負責人張新原在接受《商學院》記者采訪時,以辯證視角肯定了該模型的開源策略,認為其憑借強大的語言理解與生成能力、對海量文本數(shù)據(jù)的處理能力以及廣泛的應用場景,在自然語言處理、機器學習、人工智能等領域表現(xiàn)出色;此外,其萬億級參數(shù)規(guī)模不僅提升了模型的計算和泛化能力,還賦予了極高的靈活性和可擴展性,使其能夠針對不同需求進行優(yōu)化。與此同時,該模型在訓練和部署上存在成本高、調(diào)試優(yōu)化難度大以及潛在缺陷等問題,需要更多測試和驗證來保障穩(wěn)定性。
中關村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥認為,騰訊混元在中文創(chuàng)作、邏輯推理和任務執(zhí)行方面有優(yōu)勢,并強調(diào)通過開源可以降低技術(shù)門檻,促進企業(yè)和開發(fā)者的二次開發(fā)與技術(shù)合作,從而進一步推動技術(shù)進步和行業(yè)發(fā)展。
騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù),再構(gòu)建生態(tài)矩陣,最終實現(xiàn)商業(yè)化閉環(huán)”的理念,對于騰訊未來能否實現(xiàn)商業(yè)化落地,《商學院》記者將持續(xù)關注。
來源 | 2025年4月刊
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.