文心大模型4.5 Turbo,源自文心4.5,是效果更好、成本更低的多模態(tài)大模型。基于文心4.5 Turbo,X1升級到X1 Turbo,性能提升的同時(shí),具備更先進(jìn)的思維鏈,問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng)。
【技術(shù)亮點(diǎn)】
1. 基礎(chǔ)模型
文心4.5和4.5 Turbo是多模態(tài)大模型,實(shí)現(xiàn)了文本、圖像和視頻等不同模態(tài)的混合訓(xùn)練。針對不同模態(tài)數(shù)據(jù)在結(jié)構(gòu)、規(guī)模、知識密度上的差異,通過多模態(tài)異構(gòu)專家建模、自適應(yīng)分辨率視覺編碼、時(shí)空重排列的三維旋轉(zhuǎn)位置編碼、時(shí)空維度表征壓縮、自適應(yīng)模態(tài)感知損失計(jì)算等技術(shù),大幅提升跨模態(tài)學(xué)習(xí)效率和多模態(tài)融合效果,學(xué)習(xí)效率提高近2倍,多模態(tài)理解效果提升超過30%。
2.后訓(xùn)練
研制了自反饋增強(qiáng)的技術(shù)框架,基于大模型自身的生成和評估反饋能力,實(shí)現(xiàn)了“訓(xùn)練-生成-反饋-增強(qiáng)”的模型迭代閉環(huán),不僅解決了大模型對齊過程中數(shù)據(jù)生產(chǎn)難度大、成本高、速度慢等問題,而且顯著降低了模型幻覺,模型理解和處理復(fù)雜任務(wù)的能力大幅提升。
在訓(xùn)練階段,研制了融合偏好學(xué)習(xí)的強(qiáng)化學(xué)習(xí)技術(shù),通過多元統(tǒng)一獎(jiǎng)勵(lì)機(jī)制,提升了對結(jié)果質(zhì)量判別的準(zhǔn)確率,通過離線偏好學(xué)習(xí)和在線強(qiáng)化學(xué)習(xí)統(tǒng)一優(yōu)化,進(jìn)一步提升了數(shù)據(jù)利用效率和訓(xùn)練穩(wěn)定性,并增強(qiáng)了模型對高質(zhì)量結(jié)果的感知。得益于偏好信號與獎(jiǎng)勵(lì)信號的融合運(yùn)用,模型的理解、生成、邏輯推理和記憶等能力得以全面提升。
3.深度思考
突破了僅基于思維鏈優(yōu)化的范式,在思考路徑中結(jié)合工具調(diào)用,構(gòu)建了融合思考和行動的復(fù)合思維鏈,模型解決問題能力得到顯著提升。同時(shí),結(jié)合多元統(tǒng)一的獎(jiǎng)勵(lì)機(jī)制,實(shí)現(xiàn)了長距離思維和行動鏈的端到端優(yōu)化,顯著提升了跨領(lǐng)域解決問題的能力。
4.數(shù)據(jù)
打造了“數(shù)據(jù)挖掘與合成 - 數(shù)據(jù)分析與評估 - 模型能力反饋”的數(shù)據(jù)建設(shè)閉環(huán),為模型訓(xùn)練源源不斷地生產(chǎn)知識密度高、類型多樣、領(lǐng)域覆蓋廣的大規(guī)模數(shù)據(jù),同時(shí),數(shù)據(jù)建設(shè)流程具備良好的可擴(kuò)展性,可輕松遷移到全新的數(shù)據(jù)類型,實(shí)現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)。具體而言,
針對專業(yè)深度知識及領(lǐng)域過程知識的數(shù)據(jù)稀缺問題,研制了原理驅(qū)動、過程評估與結(jié)果校驗(yàn)的數(shù)據(jù)合成技術(shù)、知識點(diǎn)驅(qū)動的大規(guī)模稀缺數(shù)據(jù)挖掘技術(shù),顯著提升數(shù)據(jù)的知識密度和覆蓋面。
多模態(tài)數(shù)據(jù)方面,針對不同模態(tài)數(shù)據(jù)割裂、跨模態(tài)語義關(guān)聯(lián)難度大等問題,提出了融合語義對齊的多模態(tài)平行數(shù)據(jù)構(gòu)建、融合視覺知識的描述生成等技術(shù),大幅提升不同模態(tài)數(shù)據(jù)的對齊精度和深度語義關(guān)聯(lián),增強(qiáng)多模態(tài)理解能力。
【基準(zhǔn)測試】
文心4.5 Turbo高效繼承文心4.5的文本和多模態(tài)能力,同時(shí)顯著降低訓(xùn)練和推理成本,多模態(tài)能力與GPT 4.1持平、優(yōu)于GPT 4o,文本能力與DeepSeek V3最新版持平,優(yōu)于GPT 4.5、GPT 4.1、GPT 4o。
文心4.5 Turbo-多模態(tài)
文心4.5 Turbo -文本
深度思考模型文心 X1 Turbo整體效果領(lǐng)先DeepSeek R1、V3最新版,略低于GPT o1滿血版。
文心X1 Turbo
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.