99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

文心4.5系列模型開源,普惠AI開發新生態

0
分享至

始智AI wisemodel.cn開源社區

始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。,A800/H20等算力6.25元/卡時,支持在線微調訓練,及線部署和。

在人工智能飛速發展的當下,大模型已成為推動各行業變革的核心力量。近日,百度文心4.5系列模型正式開源。該系列開源模型共10款,涵蓋了激活參數規模分別為47B和3B的混合專家(MoE)模型(最大的模型總參數量為424B),以及0.3B的稠密參數模型。

模型權重按照Apache 2.0協議開源,支持開展學術研究和產業應用,此外,基于飛槳提供開源的產業級開發套件,廣泛兼容多種芯片,降低后訓練和部署門檻。現已上線始智AI-wisemodel開源社區,歡迎使用和體驗。

模型地址

https://wisemodel.cn/organization/PaddlePaddle

01.

模型整體介紹

針對 MoE 架構,百度提出了一種創新性的多模態異構模型,通過跨模態參數共享機制實現模態間知識融合,同時為各單一模態保留專用參數空間。此架構非常適用于從大語言模型向多模態模型的持續預訓練范式,在保持甚至提升文本任務性能的基礎上,顯著增強多模態理解能力。


文心4.5系列模型均使用飛槳深度學習框架進行高效訓練、推理和部署。在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。

實驗結果顯示,該系列模型在多個文本和多模態基準測試中達到SOTA水平,在指令遵循、世界知識記憶、視覺理解和多模態推理任務上效果尤為突出。文心4.5系列模型在Benchmark上效果體現:


02.

核心技術亮點

多模態混合專家模型預訓練

文心4.5通過在文本和視覺兩種模態上進行聯合訓練,更好地捕捉多模態信息中的細微差別,提升在文本生成、圖像理解以及多模態推理等任務中的表現。

為了讓兩種模態學習時互相提升,百度 提出 了 一種多 模態異構混合專家模型結構,結合了多維旋轉位置編碼,并且在損失函數計算時,增強了不同專家間的正交性,同時對不同模態間的詞元進行平衡優化,達到多模態相互促進提升的目的。

高效訓練推理框架

為了支持文心4.5模型的高效訓練,百度提出了異構混合并行和多層級負載均衡策略。通過節點內專家并行、顯存友好的流水線調度、FP8混合精度訓練和細粒度重計算等多項技術,顯著提升了預訓練吞吐。

推理方面,百度提出了多專家并行協同量化方法和卷積編碼量化算法,實現了效果接近無損的4-bit量化和2-bit量化。此外,文心還實現了動態角色轉換的預填充、解碼分離部署技術,可以更充分地利用資源,提升文心4.5 MoE模型的推理性能。基于飛槳框架,文心4.5在多種硬件平臺均表現出優異的推理性能。

針對模態的后訓練

為了滿足實際場景的不同要求,文心對預訓練模型進行了針對模態的精調。其中,大語言模型針對通用語言理解和生成進行了優化,多模態大模型側重于視覺語言理解,支持思考和非思考模式。每個模型采用了SFT、DPO或UPO(統一偏好優化技術)的多階段后訓練。


03.

完整的開發工具鏈

基于多年飛槳開源技術與生態系統積累,此次文心4.5模型系列開源同 步升級發布文心大模型開發套件ERNIEKit大模型高效部署套件FastDeploy,為文心4.5模型及開發者提供 開箱即用的工具和全流程支持。

1、

基于飛槳的
文心大模型開發套件ERNIEKit

ERNIEKit為用戶提供預訓練、全參精調(SFT)、直接偏好優化(DPO)、參數高效精調與對齊(SFT-LoRA/DPO-LoRA)、訓練感知量化(QAT)和訓練后量化(PTQ)等大模型全流程開發支持。

使用示例:

# 下載模型
huggingface-cli download baidu/ERNIE-4.5-0.3B-Paddle --local-dir baidu/ERNIE-4.5-0.3B-Paddle
# 一行命令啟動訓練
erniekit train examples/configs/ERNIE-4.5-0.3B/sft/run_sft_8k.yaml

2、

基于飛槳的
大模型高效部署套件FastDeploy

FastDeploy提供了一行代碼開箱即用的多硬件部署體驗,使用接口兼容vLLM和OpenAI協議。針對旗艦模型提供了產業級多級負載均衡的PD分離部署方案,支持豐富的低比特量化推理、上下文緩存、投機解碼等加速技術。

本地推理示例:

from fastdeploy import LLM, SamplingParams
prompt = "把李白的靜夜思改寫為現代詩"
sampling_params = SamplingParams(temperature=0.8, top_p=0.95)
llm = LLM(model="baidu/ERNIE-4.5-0.3B-Paddle", max_model_len=32768)
outputs = llm.generate(prompt, sampling_params)?

服務部署示例:

python -m fastdeploy.entrypoints.openai.api_server \
    --model "baidu/ERNIE-4.5-0.3B-Paddle" \
    --max-model-len 32768 \
    --port 9904

----- END -----

wisemodel相關:

系統升級:

3、

系列模型:

關于wisemodel更多

1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一定要戴手套!上海男子8天離世,死亡率近100%:你我都在犯!

一定要戴手套!上海男子8天離世,死亡率近100%:你我都在犯!

華庭講美食
2025-07-17 01:55:44
未來首發中鋒?美媒曬利拉德重返開拓者全新陣容:楊瀚森位列五虎之中

未來首發中鋒?美媒曬利拉德重返開拓者全新陣容:楊瀚森位列五虎之中

雷速體育
2025-07-18 06:39:10
7月18日精選熱點:碳纖維再次重磅利好,這些核心龍頭受益

7月18日精選熱點:碳纖維再次重磅利好,這些核心龍頭受益

元芳說投資
2025-07-17 21:21:09
施幼珍對宗慶后幫襯少,娘家沒資源,自己實力弱,沒追生兒子

施幼珍對宗慶后幫襯少,娘家沒資源,自己實力弱,沒追生兒子

歡樂大意
2025-07-17 21:21:30
中聯重科別車車主后續,知情人爆料身份大快人心,官方回復秒打臉

中聯重科別車車主后續,知情人爆料身份大快人心,官方回復秒打臉

素衣讀史
2025-07-17 17:41:16
官方價沒套路,捷豹XEL官降,15.98w起

官方價沒套路,捷豹XEL官降,15.98w起

熱點科技
2025-07-17 17:59:31
WTO有點過時了,如今 CPTPP成為香餑餑!我們要二次申請了……

WTO有點過時了,如今 CPTPP成為香餑餑!我們要二次申請了……

翻開歷史和現實
2025-07-16 20:57:29
倒閉1.2萬家!80后集體記憶轟然崩塌,50臺電腦年入千萬神話破滅

倒閉1.2萬家!80后集體記憶轟然崩塌,50臺電腦年入千萬神話破滅

財經八卦
2025-07-17 23:34:18
科技股大牛市!天量資金涌入三大板塊

科技股大牛市!天量資金涌入三大板塊

君臨財富
2025-07-17 16:30:02
17個交易日后!西部實力一目了然:5隊S級、2隊A級!

17個交易日后!西部實力一目了然:5隊S級、2隊A級!

運籌帷幄的籃球
2025-07-17 17:07:36
誰能想到,宗老變老宗,有沒有想過,他愛穿布鞋,是不是這個原因?

誰能想到,宗老變老宗,有沒有想過,他愛穿布鞋,是不是這個原因?

青苔同學
2025-07-16 16:29:15
生完孩子后,我出軌的欲望非常強烈!(女性勿入)

生完孩子后,我出軌的欲望非常強烈!(女性勿入)

性學研究僧
2025-06-17 22:37:40
住建部新定調:滿25年房齡的老房子,一律按新規處理,業主要發財

住建部新定調:滿25年房齡的老房子,一律按新規處理,業主要發財

阿傖說事
2025-07-17 09:08:01
董璇張維伊婚宴敬酒照、伴娘團曝光,其女兒小酒窩成“最萌亮點”

董璇張維伊婚宴敬酒照、伴娘團曝光,其女兒小酒窩成“最萌亮點”

文娛沒有圈
2025-07-17 16:16:29
“多處咬痕、身體被老虎鉗夾爛”,被凌辱致死的女人為何一言不發

“多處咬痕、身體被老虎鉗夾爛”,被凌辱致死的女人為何一言不發

大案九處
2025-07-17 14:30:40
杜建英段年輕時靚照曝光,長發溫柔短發干練,望著宗慶后好深情

杜建英段年輕時靚照曝光,長發溫柔短發干練,望著宗慶后好深情

葉公子
2025-07-16 15:04:57
網友們開始在念鐘睒睒的好了,因為他給宗慶后留足體面了

網友們開始在念鐘睒睒的好了,因為他給宗慶后留足體面了

清暉有墨
2025-07-17 09:03:22
央視曝光!這些產品中檢測出甲醛,嚴重可致癌,有人已中招

央視曝光!這些產品中檢測出甲醛,嚴重可致癌,有人已中招

削桐作琴
2025-07-17 15:32:28
俄羅斯應對的三張牌:歸還遠東領土,放棄外蒙古,唐努烏海回歸

俄羅斯應對的三張牌:歸還遠東領土,放棄外蒙古,唐努烏海回歸

阿芒娛樂說
2025-07-11 01:20:04
廣東省能源集團黨委原副書記黎凱生接受審查調查

廣東省能源集團黨委原副書記黎凱生接受審查調查

界面新聞
2025-07-17 17:03:20
2025-07-18 06:51:00
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
309文章數 12關注度
往期回顧 全部

科技要聞

沒有老黃不夸的中國公司了吧??

頭條要聞

知情人:宗慶后有個孩子2017年出生 生母為年輕員工

頭條要聞

知情人:宗慶后有個孩子2017年出生 生母為年輕員工

體育要聞

楊力維和楊舒予,是姐妹,也是戰友

娛樂要聞

又相信愛情了,董璇二婚現場照曝光!

財經要聞

杭州成立專班介入宗慶后遺產糾紛

汽車要聞

有望年內上市 奧迪A6L e-tron申報信息曝光

態度原創

健康
房產
家居
游戲
教育

呼吸科專家破解呼吸道九大謠言!

房產要聞

突發!海航陳峰被判12年,罰2.2億!

家居要聞

空間分明 時尚風格并存

魔獸懷舊服:HICC小怪削弱繼承,雙天賦出現BUG,0buff將持續四周

教育要聞

痛!放棄985,父母賣房供女兒讀悉尼大學,4年后回國竟找不到工作

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 黄大仙区| 公主岭市| 钟祥市| 大兴区| 汉川市| 平乡县| 临颍县| 承德市| 茌平县| 扬中市| 广东省| 西安市| 缙云县| 诸城市| 宣恩县| 京山县| 抚远县| 土默特左旗| 定南县| 莱芜市| 邳州市| 和龙市| 宁津县| 晋江市| 多伦县| 育儿| 日喀则市| 工布江达县| 新郑市| 岳西县| 阜平县| 孙吴县| 凯里市| 茌平县| 琼中| 阿克| 江油市| 海阳市| 延边| 江永县| 辽中县|