基礎大模型研發已步入深水區,模型廠商和芯片廠商正通過聯合技術創新的模式,讓大模型和算力雙向實現價值最大化,加速推動大模型真正被各行各業用起來。
7 月 25 日,階躍星辰在上海召開「Step 3 大模型發布會暨生態聯盟成立大會」,會上階躍發布了新一代基礎大模型 Step 3,這款模型兼顧智能與效率,旨在面向推理時代打造最適合應用的模型,將于7月31日面向全球企業和開發者開源,為開源世界貢獻最強多模態推理模型。憑借系統和架構創新,Step 3 實現了行業領先的推理解碼效率。根據原理分析,Step 3 在國產芯片上的推理效率最高可達 DeepSeek-R1 的300%,且對所有芯片友好。在基于 NVIDIA Hopper 架構的芯片進行分布式推理時,實測 Step 3 相較于 DeepSeek-R1 的吞吐量提升超 70%。
值得關注的是,為了通過底層聯合創新提升大模型適配性和算力效率,階躍星辰聯合近 10 家芯片及基礎設施廠商發起「模芯生態創新聯盟」,打通芯片、模型和平臺全鏈路技術。該聯盟將為企業和開發者提供高效易用的大模型解決方案,加速應用落地。該聯盟首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。目前,華為昇騰芯片已首先實現 Step 3 的搭載和運行。沐曦、天數智芯和燧原等也已初步實現運行 Step 3。其它聯盟廠商的適配工作正在開展。
面向推理時代,能否降低推理成本也是決定大模型應用滲透率的關鍵問題。業內人士認為,API 價格戰帶來的普及只有短期效應,要徹底推動 AI 技術惠民需要發展可持續模式,通過模型系統架構創新是最本質的解題思路?!改P旧鷳B創新聯盟」的發起,是模型、芯片、基礎設施全鏈路技術廠商協同探索創新的良好開始。Step 3 已經通過開源技術報告,與全球開發者分享了大幅降低推理成本背后的系統架構創新。
此外,本次 WAIC 期間,階躍亦升級了多模態模型,包括階躍首個多模理解生成一體化模型 Step 3o Vision,第二代端到端語音大模型 Step-Audio 2。目前,所有這些模型都可以在“階躍 AI”官網(stepfun.com)和“階躍 AI”App(應用商店搜索下載)進行體驗。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.