階躍星辰CEO姜大昕
7月26日消息,2025年世界人工智能(WAIC)大會暨人工智能全球治理高級別會議今天在上海啟幕。
本屆WAIC以“智能時代 同球共濟”為主題,來自30余個國家和地區的1200余位嘉賓齊聚滬上,其中包括12位圖靈獎、諾貝爾獎等頂獎得主,80余位中外院士,以及多個國際頂尖實驗室代表;展廳方面,展覽面積首次突破7萬平方米,吸引800余家企業參展,集中發布3000余項前沿展品,包括40余款大模型、50余款AI終端產品、60余款智能機器人及100余款“全球首發”或“中國首秀”新品。
WAIC大會前一天,上海AI大模型頭部公司階躍星辰發布新一代基礎大模型——Step 3,是公司首個全尺寸、原生多模態推理模型,采用MoE架構,總參數量321B(3210億),激活參數量380億。其中包括階躍首個多模理解生成一體化模型Step 3o Vision,第二代端到端語音大模型Step-Audio 2。
同時,Step 3兼顧模型效果與推理成本,擁有強大視覺感知和復雜推理能力,可準確完成跨領域的復雜知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題,并在MMMU等多個榜單上取得了開源多模態推理模型的SOTA成績。
此外,算力優化層面,階躍星辰重點發力國產芯片推理,Step 3系列在國產芯片上的推理效率最高可達DeepSeek-R1的300%,推理輸出理論成本低于MiniMax M1、Kimi K2等最新模型;而在基于英偉達Hopper架構芯片進行分布式推理時,實測Step 3相較于DeepSeek-R1的吞吐量提升超70%。據悉,Step 3將于7月31日面向全球企業和開發者開源,目前Step 3已授權國內多家芯片公司,并完成了芯片適配。
會上,階躍星辰CEO姜大昕還宣布,上海國投生態體系將在近期參與投資階躍星辰的最新一輪融資,以及階躍星辰今年的收入沖刺目標定為10億元人民幣。據悉,本輪階躍星辰總融資額預計超過5億美元(約合35.77億元),或創2025年AI大模型行業單輪融資最高。
姜大昕會后對筆者表示,大模型走到今天已經從GPT范式的1.0走到了強化學習范式下的2.0,當前堅持訓練模型的公司正在變少,“每個行業節點都會有公司掉隊。”
姜大昕指出,大模型商業化和AGI技術目標是相互牽引的關系。AGI本身就是要打造模型能力,而應用是給了模型的實際場景,甚至說是AI應用牽引著AI模型。階躍星辰一直堅持“超級模型+超級應用”,兩者關系非常緊密,一方面模型能力會決定應用上限,另一方面,應用也給了模型提供具體場景和數據,兩者并不存在選擇問題。
階躍星辰副總裁李璟進一步向筆者解釋稱,一直以來,階躍星辰在商業化打法和策略上有非常多的獨特性,公司成立之初就意識到,偏定制化、純賣API這兩種商業模式不是特別可持續,尤其大廠能“賣云送模型”,所以他認為,大模型API的商業化注定是大廠的生意邏輯。
李璟指出,如今階躍星辰的商業化非常聚焦,非常擅長去2B2C、ToC兩個方向打造一些產品級收入,包括超50%頭部國產手機品牌已接入階躍多模態能力,以及擁有金融、汽車領域的客戶。李璟指出,上半年階躍星辰收入合同收入規模已有數億元,確認收入和毛利水平都表現較好,全年10億元這一目標是確認性收入,而非訂單性收入,今年全年有望完成10億收入目標。
據悉,階躍星辰成立于2023年4月,是行業領先的通用大模型創業公司。成立兩年多,階躍星辰已構建起“1+N”的Step系列大模型矩陣,“1”是指Step 3基礎大模型;“N”則為Step系列的多模態大模型矩陣,已累計發布超過20多款自研基座模型,覆蓋文字、語音、圖像、視頻、音樂、推理等全系列、覆蓋語音、視覺理解、圖像等領域。
姜大昕向筆者確認,在組織架構中,視頻生成團隊全面轉向在“多模理解生成一體化”技術組里面。而“多模理解生成一體化”是當前階躍星辰建立世界模型的最佳路徑之一,從而往智能涌現、AI Agent和通用人工智能(AGI)方向發展。
此外,階躍星辰宣布聯合壁仞科技、燧原科技、無問芯穹、摩爾線程、沐曦股份、寒武紀、華為昇騰等近10家芯片及基礎設施廠商,共同發起“模芯生態創新聯盟”,致力于打通芯片、模型和平臺全鏈路技術。
目前,華為昇騰芯片已首先實現Step 3的搭載和運行。沐曦、天數智芯和燧原科技等也已初步實現運行Step 3。
階躍星辰聯合創始人兼副總裁朱亦博表示,他表示,模型每推理一個token所訪問的顯存和進行的計算量,與其注意力機制有關。團隊考慮到行業當前在英偉達H800和H20等芯片所受到的限制,Step 3在架構設計層面重點考量了國產芯片的計算特性,在訪存比(計算量/訪存量)斜率上優先貼近國產芯片,使其運行過程中不會出現嚴重的計算瓶頸或顯存瓶頸。
朱亦博進一步稱,這種聯盟并非做算力型的“壟斷”。現在階躍星辰算力層面的第一目標,是能夠在推理側不依賴英偉達,但團隊并沒有刻意要“排斥”任何一種芯片,主要因為大模型發展既是一個商業問題也是一種科學問題,那么在當前條件下,團隊首先面對的是在模型智能層面“咬住”美國最尖端模型,不要被拉得太遠。至于模型用什么樣的芯片,也是根據現有的條件做出被動選擇,而非階躍的主觀選擇。
姜大昕坦言,實事求是講,整個大模型領域我們看到的還是中國在追美國這樣一個趨勢,這是資源有限情況下比較有效或比較“聰明”的策略。所以,中國其實是在“追趕”美國的頂尖模型,但追趕的過程中也是一個創新的過程。
值得一提的是,7月25日會議上,沐曦創始人、董事長兼總經理陳維良,天數智芯董事長兼CEO蓋魯江,燧原科技創始人、董事長兼CEO趙立東和壁仞科技創始人、董事長兼CEO張文四位國產AI芯片CEO首度罕見同臺,這些企業被媒體稱為“上海英偉達”。千里科技董事長印奇擔任主持。
一上臺,印奇就拋出一個問題:“大家能不能用一句話,總結一下最近六個月的狀態?”
對此,陳維良表示,內外環境復雜,做芯片不容易,所以上半年很忙很累,但是很充實。
蓋魯江稱,上半年波瀾壯闊,期待下半年大有所為。
趙立東則表示,模型和國產芯片“雙向奔赴”是我們未來實現國產AI生態最重要的部分,“我們看到了希望,下半年加油”。
張文稱,上半年的話我們經歷了各種各樣國際上的壓力,我們幾家扛過來了,祝賀各位,也期待未來發展更好。
對于大模型是否用好,張文進一步表示,毫無疑問,中國大模型應用已經“沒問題”了。“OpenAI去年就提出了五級AGI路線圖,它的分級與自動駕駛非常類似,也有L1-L5的不同階段。終極的AGI就如同L5自動駕駛,將會實現無人化,也就是徹底取代人來處理各種復雜任務。我們目前的大模型,包括DeepSeek,處在L2,也就是Reasoner(推理AI)的水平。”
趙立東表示,大模型使用的核心在于“推理”,最早從美國ChatGPT開始,中國起步較晚,今年春節DeepSeek R1讓大家在生活中能夠方便地使用大模型的推理,從而開始普及。另外,基于開源的大模型進行二次、三次開發的時候,將會有更多針對行業,針對應用場景的蒸餾版出現。今天階躍星辰發布Step3,一方面針對國產卡,另外一方面強調開源,這會極大推動模型的落地。
“講到痛點,芯片企業的痛點我不多說,牽扯到很復雜的國際背景,但我很高興聽到,剛才發布當中一再強調的降低成本,這是非常重要的。無論模型也好,還是芯片也好,如果想長期、可持續性發展,就要實現從技術產品的閉環到商業化閉環,換句話說要降低成本要賺錢,不然就不可持續。所以在這一點上,恰恰是我們未來的目標,以及我們需要加強協作來實現更高性價比,更好的效率或者商業利益。”趙立東稱。
對于國產算力發展,趙立東表示,國產AI芯片一直有兩座大山:一是高端芯片制造,另外一個就是生態。
趙立東指出,特別是高性能推理,AI芯片公司最大機遇就是大模型和芯片如何深度優化,經過幾年磨合,燧原產品的性價比是可以做到兩倍到三倍,對標英偉達(NV)的芯片,同時價格上、成本上也有一定優勢,性價比需要持續提升。“對推理來講,你要落地,如果實現不了商業化的利益,換句話說,不能盈利,這個事兒不可長久、不可持續,所以我們一直強調算力普惠。”
張文強調,國產大模型對國產芯片的發展特別重要,因為國內大模型的水平和國外差不多,但國產芯片(和英偉達的)差距還是比較大的,設計芯片是挺痛苦的事。從開始設計到做出來是兩年以后的事情,所以一定要有前瞻性,才能把芯片設計好。而適配國產大模型公司對芯片公司的產品定義有非常大的幫助,根據他們的需求,包括針對大模型的超長文本、MoE架構、多模態、大規模推理等特性,從而對產品做一個調整。
“所以從某種意義上,國內大模型的發展牽動著國內芯片設計的發展。”張文稱。
(本文首發于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.