3月16日,文心大模型4.5和文心大模型X1正式發(fā)布!
目前,兩款模型已在文心一言官網(wǎng)上線,免費(fèi)向用戶開放。(https://yiyan.baidu.com)
同時(shí),文心大模型4.5已上線百度智能云千帆大模型平臺(tái),企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產(chǎn)品,將陸續(xù)接入文心大模型4.5和文心大模型X1,為用戶帶來更多元的體驗(yàn)。
文心大模型4.5
原生多模態(tài)基礎(chǔ)大模型
文心大模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型,通過多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語(yǔ)言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
多模態(tài)能力
文本能力
文心大模型4.5具備優(yōu)秀的多模態(tài)理解能力,能對(duì)文字、圖片、音頻、視頻等內(nèi)容進(jìn)行綜合理解。例如,針對(duì)下面這道題,文心大模型4.5綜合理解了圖中的文字與圖表內(nèi)容,提取出題目考查的重點(diǎn);并給出詳細(xì)的解題步驟和細(xì)化的選項(xiàng)分析,最終得出正確答案。
不僅是“高智商”,文心大模型4.5也擁有“高情商”,網(wǎng)絡(luò)梗圖、諷刺漫畫等等,理解起來都不在話下。例如,在下文中,這張梗圖蘊(yùn)含著“連續(xù)不一定可倒(導(dǎo))、可倒(導(dǎo))一定連續(xù)”的數(shù)學(xué)概念,文心大模型4.5不僅秒懂,點(diǎn)出梗圖的巧妙和幽默;還能詳細(xì)對(duì)其中蘊(yùn)含的數(shù)學(xué)概念和畫面邏輯進(jìn)行解釋。
文心大模型4.5能力顯著增強(qiáng),離不開這些關(guān)鍵技術(shù):
◎FlashMask動(dòng)態(tài)注意力掩碼:加速大模型靈活注意力掩碼計(jì)算,有效提升長(zhǎng)序列建模能力和訓(xùn)練效率,優(yōu)化長(zhǎng)文處理能力和多輪交互表現(xiàn);
◎多模態(tài)異構(gòu)專家擴(kuò)展技術(shù):根據(jù)模態(tài)特點(diǎn)構(gòu)建模態(tài)異構(gòu)專家,結(jié)合自適應(yīng)模態(tài)感知損失函數(shù),解決不同模態(tài)梯度不均衡問題,提升多模態(tài)融合能力;
◎時(shí)空維度表征壓縮技術(shù):在時(shí)空維度對(duì)圖片和視頻的語(yǔ)義表征進(jìn)行高效壓縮,大幅提升多模態(tài)數(shù)據(jù)訓(xùn)練效率,增強(qiáng)了從長(zhǎng)視頻中吸取世界知識(shí)的能力;
◎基于知識(shí)點(diǎn)的大規(guī)模數(shù)據(jù)構(gòu)建技術(shù):基于知識(shí)分級(jí)采樣、數(shù)據(jù)壓縮與融合、稀缺知識(shí)點(diǎn)定向合成技術(shù),構(gòu)建高知識(shí)密度預(yù)訓(xùn)練數(shù)據(jù),提升模型學(xué)習(xí)效率,大幅降低模型幻覺;
◎基于自反饋的Post-training技術(shù):融合多種評(píng)價(jià)方式的自反饋迭代式后訓(xùn)練技術(shù),全面提升強(qiáng)化學(xué)習(xí)穩(wěn)定性和魯棒性,大幅提升預(yù)訓(xùn)練模型對(duì)齊人類意圖能力。
文心大模型X1
能力更全面的深度思考模型
文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個(gè)自主運(yùn)用工具的深度思考模型。作為能力更全面的深度思考模型,文心大模型X1兼?zhèn)錅?zhǔn)確、創(chuàng)意和文采,在中文知識(shí)問答、文學(xué)創(chuàng)作、文稿寫作、日常對(duì)話、邏輯推理、復(fù)雜計(jì)算及工具調(diào)用等方面表現(xiàn)尤為出色。
作為能自主運(yùn)用工具的大模型,文心大模型X1已支持高級(jí)搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁(yè)鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢等多款工具。
例如,讓文心大模型X1使用中國(guó)各朝代歷史人物典故,替換《寒窯賦》原文中的事例,它展現(xiàn)出清晰的思維鏈:找到和原文相似的人物典故→注意文風(fēng)和句式→檢查人物典故的適配度→行文保持結(jié)構(gòu)流暢,最后生成了和原文立意、文風(fēng)句式都基本一致的文本。
文心大模型X1能力的全面提升,得益于這些關(guān)鍵技術(shù)的支撐:
◎遞進(jìn)式強(qiáng)化學(xué)習(xí)訓(xùn)練方法:創(chuàng)新性地應(yīng)用遞進(jìn)式強(qiáng)化學(xué)習(xí)方法,在創(chuàng)作、搜索、工具調(diào)用、推理等場(chǎng)景全面提升模型的綜合應(yīng)用能力;
◎基于思維鏈和行動(dòng)鏈的端到端訓(xùn)練:針對(duì)深度搜索、工具調(diào)用等場(chǎng)景,根據(jù)結(jié)果反饋進(jìn)行端到端的模型訓(xùn)練,顯著提升訓(xùn)練效果;
◎多元統(tǒng)一的獎(jiǎng)勵(lì)系統(tǒng):建立了統(tǒng)一的獎(jiǎng)勵(lì)系統(tǒng),融合多種類型的獎(jiǎng)勵(lì)機(jī)制,為模型訓(xùn)練提供更加魯棒的反饋。
體驗(yàn)全新文心大模型4.5與文心大模型X1
↓指路↓
文心一言官網(wǎng),即刻免費(fèi)體驗(yàn)兩款全新大模型!(https://yiyan.baidu.com)
在百度智能云千帆大模型平臺(tái),現(xiàn)可直接調(diào)用文心大模型4.5API,輸入價(jià)格低至0.004元/千tokens,輸出價(jià)格低至0.016元/千tokens;文心大模型X1也即將在千帆平臺(tái)上線,輸入價(jià)格低至0.002元/千tokens,輸出價(jià)格低至0.008元/千tokens。
2025是大模型技術(shù)全面迭代的一年,我們將在人工智能、數(shù)據(jù)中心、云基礎(chǔ)設(shè)施上更大膽地投入,打造更好、更智能的下一代模型。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.