騰訊重構混元大模型研發體系
據了解,近日,騰訊對其混元大模型研發體系進行了全面重構,主要是圍繞算力、算法和數據三大核心板塊展開,通過優化團隊部署和加碼研發投入,推動混元大模型的持續發展。
調整后,騰訊成立了兩個新的部門:大語言模型部和多模態模型部,分別負責探索大語言模型和多模態大模型的前沿技術,持續迭代基礎模型,提升模型能力。
同時,騰訊將進一步加強大模型數據能力和平臺底座建設。
其中,數據平臺部專注大模型數據全流程管理與建設,機器學習平臺部則聚焦機器學習與大數據融合平臺建設,為 AI 模型訓練推理、大數據業務提供全面高效的 PaaS 平臺底座,共同支撐騰訊混元大模型的技術研發。
圖源:每日經濟新聞公眾號
顯然,騰訊想要對底層技術瓶頸進行系統性突破,對混元大模型研發體系進行調整有利于整合資源,優化研發流程,進一步提升騰訊在AI領域的長期技術作戰能力。
值得一提的是,最近一段時間以來,騰訊在AI領域的組織架構調整動作不斷——
先是騰訊元寶從TEG(技術工程事業群)劃歸至CSIG(云與產業事業群);
然后是QQ瀏覽器、搜狗輸入法、ima等原屬PCG(平臺與內容事業群)的產品線及團隊,整體遷移至CSIG。
完成這一系列調整后,騰訊建立起了一個包含元寶、ima、QQ瀏覽器、搜狗輸入法四大產品線的AI產品矩陣——
其中,元寶是大模型時代的應用入口及標配的AI助手;ima則是提供智能辦公場景解決方案的工具產品;QQ瀏覽器是AI搜索與信息流重構的智能搜索;搜狗輸入法則是自然語言交互的前端入口。
通過將分散在三大事業群(TEG/PCG/CSIG)的AI產品資源集中于CSIG,騰訊形成了層級分明的"入口-工具-搜索-交互"產品閉環,同時強化了大模型與云服務的底層技術聯動。
這些舉動說明,騰訊在AI領域的布局不斷提速,步伐日益加快。
值得一提的是,騰訊2024年四季度及年度財報顯示,騰訊研發投入再次創下歷史新高,達到707億元;2018年至今累計研發投入超過3403億元。
圖源:百度
騰訊總裁劉熾平在財報電話會上表示,隨著AI能力和價值的逐步顯現,騰訊加大了AI投資,以滿足內部業務需求、訓練基礎模型,并支持日益增長的推理需求。
伴隨著投入研發資金的加碼,騰訊的AI戰略正在加速落地。
顯然,騰訊對于AI這塊“兵家必爭之地”也是勢在必得。
混元大模型的產品
混元是騰訊自研的通用大模型,支持文本、圖像、視頻和3D等多種模態內容的理解與生成。
圖源:百度
其發展時間不過短短幾年,卻已經經過了多次技術迭代和業務發展整合——
2023年9月,混元大模型正式發布,成為國內首批全面開放的通用大模型。
這是騰訊基于市場需求分析啟動的項目,也是對AI市場的初步探索,混元初期聚焦文本生成能力開發。
此后,混元大模型開始不斷進行技術迭代,集成多模態技術,新增圖像創作、視頻轉譯等能力,持續優化推理能力。
今年以來,混元大模型的技術迭代速度更是顯著加快,相繼推出快思考模型Turbo S和深度思考模型T1,在視頻生成和3D生成領域也推出多個新版本模型。
混元3D生成、視頻生成、DiT文生圖及千億參數MoE語言模型等模型均已對外開源,GitHub總Star數超過2.9萬。
目前為止,騰訊混元大模型已在 700 多個內部場景中部署,促進了多個業務領域的增長——
混元深度融入騰訊各業務線,廣泛應用于微信、QQ、騰訊元寶、騰訊會議、騰訊文檔等核心產品,提升騰訊內部產品的智能化水平,并通過騰訊云向外輸出模型能力,幫助企業和開發者創新提效。
圖源:百度
不難看出,混元大模型對于騰訊而言可謂是AI業務的核心,所以騰訊加大投入力度、調整組織結構等舉措都是為了助推混元大模型的發展,從而反哺騰訊自身其他業務的發展。
正如騰訊董事會主席兼首席執行官馬化騰所言,“我們相信這些加大的投資,會通過提升廣告業務的效率及游戲的生命周期而帶來持續的回報,并隨著我們個人AI應用的加速普及和更多企業采用我們的AI服務,創造更長遠的價值。”
值得注意的是,雖然騰訊有著自研的混元大模型,但是騰訊也在積極擁抱Deepseek——
騰訊的系列產品是最早一批擁抱DeepSeek的產品,元寶、ima、QQ瀏覽器、騰訊文檔、騰訊地圖、QQ音樂等,均宣布同時支持混元大模型與DeepSeek模型“雙引擎”,微信搜索也上線了“AI搜索”功能并接入DeepSeek-R1。
圖源:百度
不難看出,騰訊正在積極推進“核心技術自研+擁抱先進開源”的多模型策略,以應對市場的不同需求,從而助推自身技術和實力的進步與發展。
除此之外,騰訊還在大力招聘AI人才,2025年啟動三年新增2.8萬校招實習崗位計劃,技術類崗位占比超60%,覆蓋AI算法、大模型研發、云計算、游戲引擎與數字內容等70余種崗位。
圖源:騰訊微信公眾號
顯然,騰訊的目的是想儲備技術人才。
一方面,可以通過定向培養算法工程師、多模態研發人才,直接參與核心項目研發來加速混元大模型技術迭代;
另一方面,還可以應對字節跳動Seed Edge、阿里通義千問等競品的技術競爭,搶占AI人才金字塔尖。
畢竟,在AI市場中,各大企業都在紛紛發力,以圖搶占市場先機和未來發展。
AI市場競爭激烈
就當今AI市場而言,競爭日漸激烈,尤其是各個科技大廠之間你追我趕互不相讓,都希望搶占AI的高地——
就阿里而言,去年12月,阿里啟動組織架構調整,將通義千問大模型與夸克業務合并組建"AItoC"戰略板塊。
通過這一調整,阿里明確了消費級AI產品戰略方向,加速AI技術向C端應用場景的滲透。
今年3月,阿里推出了新夸克——新夸克基于阿里通義的推理與多模態大模型,由舊夸克全面升級為無邊界的“AI超級框”。
顯然,夸克的升級體現了阿里準備在AI應用側發力的決心。
有趣的是,今年阿里云也啟動近五年最大規模AI校園招聘,重點招募大模型、多模態、AI Infra等領域人才,技術崗占比超70%。
圖源:阿里巴巴集團招聘微信公眾號
不難看出,阿里也希望在AI方面儲備更多人才,從而不斷推動AI技術的發展。
就字節跳動而言,前不久,字節跳動也整合了AI研發力量,將集團級核心研究部門AI Lab整體并入大模型部門Seed。
與此同時,為了應對新一輪大模型競爭,字節跳動籌建了獨立于原有組織架構的 Flow和Seed,前者做AI產品,后者做大模型研發。
顯而易見,字節跳動的組織調整是為了優化效率,強化底層技術能力,從而在市場中更具競爭力。
值得注意的是,Seed自成立后就在不斷吸納來自字節內外的人才,并且開啟了Top Seed人才計劃,持續招募頂尖人才加入團隊。
圖源:字節跳動招聘微信公眾號
這一舉動和騰訊、阿里的目的一致,都是為了吸引更多人才來提升自身AI技術,從而搶占AI市場份額。
綜上可見,科技大廠們對于AI市場的戰略雖然不完全一致,但都離不開降本增效和人才儲備這兩個部分。
畢竟,AI來源于人,若想要更好地服務于人,自然需要更多的人才來優化AI。
在未來,AI的使用體驗或將會成為影響用戶選擇的重要因素,對此,技術、場景和生態都缺一不可,因此,AI市場的競爭或許還將不斷深入,誰能存活到最后讓人拭目以待。
作者 | 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.