文心4.5 Turbo和文心X1 Turbo

2025-04-25 11:22:06　來源: 壹度Pro

北京舉報(bào)

分享至

文心大模型4.5 Turbo，源自文心4.5，是效果更好、成本更低的多模態(tài)大模型。基于文心4.5 Turbo，X1升級到X1 Turbo，性能提升的同時(shí)，具備更先進(jìn)的思維鏈，問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng)。

【技術(shù)亮點(diǎn)】

1. 基礎(chǔ)模型

文心4.5和4.5 Turbo是多模態(tài)大模型，實(shí)現(xiàn)了文本、圖像和視頻等不同模態(tài)的混合訓(xùn)練。針對不同模態(tài)數(shù)據(jù)在結(jié)構(gòu)、規(guī)模、知識密度上的差異，通過多模態(tài)異構(gòu)專家建模、自適應(yīng)分辨率視覺編碼、時(shí)空重排列的三維旋轉(zhuǎn)位置編碼、時(shí)空維度表征壓縮、自適應(yīng)模態(tài)感知損失計(jì)算等技術(shù)，大幅提升跨模態(tài)學(xué)習(xí)效率和多模態(tài)融合效果，學(xué)習(xí)效率提高近2倍，多模態(tài)理解效果提升超過30%。

2.后訓(xùn)練

研制了自反饋增強(qiáng)的技術(shù)框架，基于大模型自身的生成和評估反饋能力，實(shí)現(xiàn)了“訓(xùn)練-生成-反饋-增強(qiáng)”的模型迭代閉環(huán)，不僅解決了大模型對齊過程中數(shù)據(jù)生產(chǎn)難度大、成本高、速度慢等問題，而且顯著降低了模型幻覺，模型理解和處理復(fù)雜任務(wù)的能力大幅提升。

在訓(xùn)練階段，研制了融合偏好學(xué)習(xí)的強(qiáng)化學(xué)習(xí)技術(shù)，通過多元統(tǒng)一獎(jiǎng)勵(lì)機(jī)制，提升了對結(jié)果質(zhì)量判別的準(zhǔn)確率，通過離線偏好學(xué)習(xí)和在線強(qiáng)化學(xué)習(xí)統(tǒng)一優(yōu)化，進(jìn)一步提升了數(shù)據(jù)利用效率和訓(xùn)練穩(wěn)定性，并增強(qiáng)了模型對高質(zhì)量結(jié)果的感知。得益于偏好信號與獎(jiǎng)勵(lì)信號的融合運(yùn)用，模型的理解、生成、邏輯推理和記憶等能力得以全面提升。

3.深度思考

突破了僅基于思維鏈優(yōu)化的范式，在思考路徑中結(jié)合工具調(diào)用，構(gòu)建了融合思考和行動的復(fù)合思維鏈，模型解決問題能力得到顯著提升。同時(shí)，結(jié)合多元統(tǒng)一的獎(jiǎng)勵(lì)機(jī)制，實(shí)現(xiàn)了長距離思維和行動鏈的端到端優(yōu)化，顯著提升了跨領(lǐng)域解決問題的能力。

4.數(shù)據(jù)

打造了“數(shù)據(jù)挖掘與合成 - 數(shù)據(jù)分析與評估 - 模型能力反饋”的數(shù)據(jù)建設(shè)閉環(huán)，為模型訓(xùn)練源源不斷地生產(chǎn)知識密度高、類型多樣、領(lǐng)域覆蓋廣的大規(guī)模數(shù)據(jù)，同時(shí)，數(shù)據(jù)建設(shè)流程具備良好的可擴(kuò)展性，可輕松遷移到全新的數(shù)據(jù)類型，實(shí)現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)。具體而言，

針對專業(yè)深度知識及領(lǐng)域過程知識的數(shù)據(jù)稀缺問題，研制了原理驅(qū)動、過程評估與結(jié)果校驗(yàn)的數(shù)據(jù)合成技術(shù)、知識點(diǎn)驅(qū)動的大規(guī)模稀缺數(shù)據(jù)挖掘技術(shù)，顯著提升數(shù)據(jù)的知識密度和覆蓋面。

多模態(tài)數(shù)據(jù)方面，針對不同模態(tài)數(shù)據(jù)割裂、跨模態(tài)語義關(guān)聯(lián)難度大等問題，提出了融合語義對齊的多模態(tài)平行數(shù)據(jù)構(gòu)建、融合視覺知識的描述生成等技術(shù)，大幅提升不同模態(tài)數(shù)據(jù)的對齊精度和深度語義關(guān)聯(lián)，增強(qiáng)多模態(tài)理解能力。

【基準(zhǔn)測試】

文心4.5 Turbo高效繼承文心4.5的文本和多模態(tài)能力，同時(shí)顯著降低訓(xùn)練和推理成本，多模態(tài)能力與GPT 4.1持平、優(yōu)于GPT 4o，文本能力與DeepSeek V3最新版持平，優(yōu)于GPT 4.5、GPT 4.1、GPT 4o。

文心4.5 Turbo-多模態(tài)

文心4.5 Turbo -文本

深度思考模型文心 X1 Turbo整體效果領(lǐng)先DeepSeek R1、V3最新版，略低于GPT o1滿血版。

文心X1 Turbo

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.