99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型下半場(chǎng),階躍憑什么領(lǐng)跑多模態(tài)之戰(zhàn)

0
分享至

作者丨王悅

編輯丨陳彩嫻

DeepSeek “掀桌”三個(gè)月后,國(guó)內(nèi)大模型的競(jìng)爭(zhēng)格局大致可劃分為三大陣營(yíng):

一是以大廠為代表的資源派,他們手握充足資本,能在基礎(chǔ)模型和落地應(yīng)用上持續(xù)燒錢(qián);二是以 DeepSeek 為代表的技術(shù)派,專(zhuān)注于基座模型的突破和投入,在推理、數(shù)理或多模態(tài)等單點(diǎn)技術(shù)上見(jiàn)長(zhǎng);三是以階躍星辰、智譜為代表的國(guó)家隊(duì),獲得地方政府的大力支持,能夠潛心做技術(shù)積累以追求全面發(fā)展。

雖然 DeepSeek 有著明顯優(yōu)勢(shì),但三股力量都在基礎(chǔ)模型上發(fā)力同時(shí)又各有長(zhǎng)處。而其中,多模態(tài)被視為 AGI 進(jìn)程中的關(guān)鍵躍遷點(diǎn),逐漸成為大模型下一階段競(jìng)爭(zhēng)的分水嶺。現(xiàn)階段多模態(tài)能力突出的獨(dú)角獸公司屈指可數(shù),有著“多模態(tài)卷王”稱(chēng)號(hào)的階躍星辰作為一個(gè)重要玩家得到了很多關(guān)注。

成立兩年的時(shí)間以來(lái),階躍星辰累計(jì)發(fā)布了22款自研基座模型,覆蓋文字、語(yǔ)音、圖像、視頻、音樂(lè)、推理等全系列,其中 16 款都是多模態(tài)模型,占比超 7 成。

外界有一種質(zhì)疑,階躍平均每個(gè)月都發(fā)布一款新模型是卷王在沖 KPI,但剖析階躍的研發(fā)條線來(lái)看就會(huì)發(fā)現(xiàn),答案是否定的。多模態(tài)的每個(gè)條線都是經(jīng)過(guò)了幾個(gè)月或者半年的積累才迭代出一個(gè)新的產(chǎn)品,這種情況下如果同時(shí)看所有模態(tài)條線,自然就形成了一兩個(gè)月就出一個(gè)新成果的局面。

和其他家不同的是,階躍從一開(kāi)始就堅(jiān)定地走理解生成一體化的路線,這也預(yù)判了當(dāng)下 AI 發(fā)展從多模態(tài)融合到多模態(tài)理解生成一體化的趨勢(shì),并且提前做出動(dòng)作。縱觀國(guó)內(nèi)大模型公司,像階躍這樣重視模態(tài)的全覆蓋、并且堅(jiān)持原生多模理念的公司并不多。

階躍星辰創(chuàng)始人、CEO 姜大昕告訴 AI 科技評(píng)論,當(dāng)下 AI 行業(yè)的技術(shù)趨勢(shì)處于非常陡峭的發(fā)展區(qū)間,追求智能的上限仍然是一件很重要的事,階躍會(huì)繼續(xù)在基礎(chǔ)大模型上投入,不錯(cuò)過(guò)這個(gè)機(jī)會(huì)。

1、多模態(tài)是下階段基模競(jìng)爭(zhēng)的技術(shù)決勝點(diǎn)

和多位階躍星辰的核心成員交流過(guò)后,AI 科技評(píng)論發(fā)現(xiàn),他們對(duì)多模態(tài)的堅(jiān)信、重視和緊迫程度要高于其他的大模型公司。姜大昕認(rèn)為,AGI 的終局不僅包括語(yǔ)言符號(hào),還包括視覺(jué)、空間、運(yùn)動(dòng)智能等,因此在多模態(tài)領(lǐng)域的任何一個(gè)方向出現(xiàn)短板,都會(huì)延緩實(shí)現(xiàn) AGI 的進(jìn)程。

自Sora 實(shí)現(xiàn)視頻生成效果的突破之后,行業(yè)內(nèi)視覺(jué)模型整體發(fā)展的絕對(duì)水平都較為有限,雖然各家在不同方面各有長(zhǎng)處,然而均在 Sora 的大框架中,未曾迎來(lái)下一個(gè)發(fā)生質(zhì)變的奇點(diǎn)時(shí)刻。

類(lèi)比 NLP 的進(jìn)化過(guò)程會(huì)發(fā)現(xiàn),自然語(yǔ)言處理經(jīng)歷了從不能規(guī)模化預(yù)訓(xùn)練,到 Transformer 這一 Scalable 的文本理解生成一體化架構(gòu),再到GPT-3 實(shí)現(xiàn)大規(guī)模文本訓(xùn)練和指令跟隨的過(guò)程。而在視覺(jué)領(lǐng)域,這一進(jìn)程甚至尚未能實(shí)現(xiàn)第一步——視覺(jué)理解生成一體化架構(gòu)。

姜大昕也坦言,知道 Sora 的 DiT 技術(shù)路線沒(méi)有按照預(yù)期中走生成理解一體化路線時(shí),第一反應(yīng)有些期待落空。但回頭一想也有道理,因?yàn)閺亩嗄B(tài)融合做到生成理解一體化,中間需要走的路著實(shí)很難。

多模態(tài)的復(fù)雜程度相較于語(yǔ)言來(lái)講要高得多。于文字而言,至多有十幾萬(wàn)個(gè) token,并且呈低維離散分布的狀態(tài),因此易于進(jìn)行表達(dá)從而實(shí)現(xiàn) next token prediction。于多模態(tài)而言,僅是一張1024×1024 的圖片就可以達(dá)到 100 萬(wàn)維,且每個(gè)維度都是高維的連續(xù)空間,難以實(shí)現(xiàn)很好的表征,從而無(wú)法實(shí)現(xiàn) next frame prediction。

如果跟隨自然語(yǔ)言的發(fā)展路徑,第一步要做的就是具備一個(gè)可以 scalable 的理解生成一體化的架構(gòu),之后才能實(shí)現(xiàn) predict next frame 、完成指令跟隨,迎來(lái)真正的“多模態(tài)大模型”。

而多模態(tài)大模型之所以關(guān)鍵,是因?yàn)槿恕C(jī)器與世界交互的形式是多模態(tài)的,Agent、具身智能等一切進(jìn)一步的人工智能實(shí)現(xiàn)形式都需要以多模態(tài)能力為基礎(chǔ)。以智能體為例,其實(shí)時(shí)的周?chē)兄拖喈?dāng)于長(zhǎng)視頻,最終的目標(biāo)是理解世界、預(yù)測(cè)行為。

在理解生成一體化、統(tǒng)一表征問(wèn)題的基礎(chǔ)上,多模態(tài)大模型即可以利用海量視頻數(shù)據(jù)做視覺(jué)預(yù)訓(xùn)練,再泛化到理解生成的各個(gè)視覺(jué)任務(wù)中。隨后在視覺(jué)領(lǐng)域引入強(qiáng)化學(xué)習(xí)和推理能力,再增加時(shí)空推理、3D模型、自然語(yǔ)言的能力,從而建模物理世界的交互,訓(xùn)練能預(yù)測(cè)行為的 VLA 模型,至此世界模型的雛形就清晰可見(jiàn)。“如果能實(shí)現(xiàn)世界模型,我眼中的 AGI 就幾乎實(shí)現(xiàn)了。”姜大昕告訴 AI 科技評(píng)論。

要突破視頻生成模型局限性,光靠在現(xiàn)有技術(shù)水平下繼續(xù)迭代是難以解決的,必須在學(xué)習(xí)范式上有所改變,理解和生成的一體化是其中繞不開(kāi)的問(wèn)題。而階躍星辰從一開(kāi)始,就確定了理解生成一體化的路線,采用原生多模的方式,在多模態(tài)融合技術(shù)上跑通了一條路。

當(dāng)下,視覺(jué)領(lǐng)域的 GPT-4 時(shí)刻還遠(yuǎn)遠(yuǎn)未到來(lái),但清晰可見(jiàn)的是多模態(tài)能力將成為 AI 大模型下一階段基礎(chǔ)模型競(jìng)爭(zhēng)的技術(shù)決勝點(diǎn)。階躍星辰仍然按照模擬世界——探索世界——?dú)w納世界的節(jié)奏進(jìn)行技術(shù)積累,繼續(xù)提升基礎(chǔ)大模型的“智能上限”和多模態(tài)能力。

2、階躍星辰的多模態(tài)競(jìng)爭(zhēng)力解剖

行業(yè)內(nèi)對(duì)階躍星辰的評(píng)價(jià),一是低調(diào),二是技術(shù)“數(shù)一數(shù)二”的強(qiáng)悍。反觀階躍星辰的技術(shù)發(fā)展路線,一直都能在火爆現(xiàn)象浮出水面之前,就踩在趨勢(shì)的前沿上。

半年多的時(shí)間以來(lái),大模型技術(shù)上有兩個(gè)趨勢(shì),一是強(qiáng)化學(xué)習(xí)的重要性越來(lái)越凸顯,從 o1 preview 將推理模型從趨勢(shì)變成范式,到 DeepSeek 摒棄監(jiān)督微調(diào),都說(shuō)明了推理能力正在打開(kāi)更大空間;二是從多模融合到多模理解生成一體化。

而在強(qiáng)化學(xué)習(xí)和多模態(tài)這兩個(gè)條線,階躍星辰均早有布局。在推理模型方面,今年1月份發(fā)布的Step R-Mini速度快、能力強(qiáng),預(yù)計(jì)未來(lái)三個(gè)月左右的時(shí)間將會(huì)推出滿(mǎn)血版推理模型Step R1;在多模態(tài)方面,堅(jiān)持走理解和生成統(tǒng)一路線,搭建了覆蓋圖片、視頻、語(yǔ)音的多模態(tài)模型矩陣。

階躍星辰之所以能對(duì)技術(shù)路線如此堅(jiān)定清晰,與核心成員是密不可分的。他們親歷了過(guò)去十年 AI 發(fā)展的歷程,有著深刻的實(shí)戰(zhàn)經(jīng)驗(yàn)和技術(shù)洞察。

創(chuàng)始人、CEO 姜大昕出身于微軟亞洲研究院 NLP 組,近 20 年的研發(fā)經(jīng)驗(yàn)使他把握住了階躍基礎(chǔ)大模態(tài)矩陣的正確的方向;首席科學(xué)家張祥雨對(duì)多模態(tài)模型的技術(shù)架構(gòu)頗有思考,參與著作的《用于圖像識(shí)別的深度殘差學(xué)習(xí)》論文(ResNet)是 21 世紀(jì)以來(lái)全球被引用次數(shù)最多的論文;系統(tǒng)負(fù)責(zé)人朱亦博也是 AI 系統(tǒng)方向的頂級(jí)專(zhuān)家,曾任字節(jié)跳動(dòng)任 AI Infra 負(fù)責(zé)人,從零開(kāi)始建設(shè)國(guó)內(nèi)最大規(guī)模的 AI Infra。

除核心領(lǐng)軍人物之外,人才密度高也是階躍星辰的一大優(yōu)勢(shì),目前公司研發(fā)人員占比 80% 以上,擁有多位計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域的頂尖研究員。

在過(guò)去一年左右的時(shí)間里,階躍星辰持續(xù)領(lǐng)跑多模態(tài)領(lǐng)域,收割國(guó)內(nèi)外多個(gè)權(quán)威榜單的第一名。不僅是技術(shù)的沉淀,在“超級(jí)模型加超級(jí)應(yīng)用”的雙輪驅(qū)動(dòng)策略中,階躍也基于自身的基礎(chǔ)模型矩陣優(yōu)勢(shì),差異化地尋找合適的應(yīng)用形態(tài)。

而 Agent 所需要的多模態(tài)和慢思考能力,是階躍的長(zhǎng)處所在。因此,階躍水到渠成地將智能終端 Agent 視為大模型技術(shù)落地的核心突破點(diǎn),最終形成一個(gè)從模型到 Agent,從云側(cè)到端側(cè)的生態(tài)體系。

當(dāng)下,汽車(chē)、手機(jī)、具身智能、IoT 等關(guān)鍵應(yīng)用場(chǎng)景是階躍突破的重點(diǎn)。面向手機(jī)終端,階躍星辰與OPPO等手機(jī)廠商推出了“一鍵問(wèn)屏”、“一鍵全能搜”功能;面向具身智能,階躍星辰與智元機(jī)器人、原力靈機(jī)達(dá)成戰(zhàn)略合作,共同探索 AI+具身機(jī)器人應(yīng)用場(chǎng)景。

除了技術(shù)和應(yīng)用,階躍星辰在商業(yè)化上也是實(shí)踐派。有開(kāi)發(fā)者反饋,階躍多模態(tài)模型的用戶(hù)付費(fèi)率最高。其中,頭部茶飲品牌茶百道全國(guó)數(shù)千家門(mén)店已經(jīng)接入階躍星辰 Step-1V 多模態(tài)理解大模型,完成智能巡檢、AIGC 營(yíng)銷(xiāo)等工作。

3、基模競(jìng)爭(zhēng)中的關(guān)鍵一極

當(dāng)前國(guó)內(nèi)大模型的競(jìng)爭(zhēng)已從“百模大戰(zhàn)”進(jìn)入“精耕細(xì)作”階段,應(yīng)用層的創(chuàng)新繞不過(guò)基礎(chǔ)模型的能力邊界,無(wú)論是復(fù)雜推理、長(zhǎng)上下文理解,還是跨領(lǐng)域知識(shí)遷移,均依賴(lài)底層模型的智能上限。

多模態(tài)能力是突破智能上限的關(guān)鍵路徑——通過(guò)融合文本、圖像、音頻等多維信號(hào),模型對(duì)世界的理解更接近人類(lèi)認(rèn)知范式,也更靠近 AGI。隨著 AI 技術(shù)的進(jìn)一步發(fā)展可以見(jiàn)得,多模態(tài)能力已從“可選項(xiàng)”到“必爭(zhēng)項(xiàng)”。要想在下一輪競(jìng)爭(zhēng)中取得優(yōu)勢(shì),多模態(tài)是一塊必爭(zhēng)之地。

身為多模態(tài)卷王的階躍星辰,憑借清晰的技術(shù)路線和堅(jiān)定的持續(xù)投入,已經(jīng)積累了多模態(tài)方面的差異化優(yōu)勢(shì)。多模態(tài)能力的提升也反哺了階躍的基礎(chǔ)大模型矩陣,在未來(lái)可見(jiàn)的具身智能、世界模型等前沿方向階躍也會(huì)“近水樓臺(tái)先得月”,成為基座大模型競(jìng)爭(zhēng)中的關(guān)鍵一極。

雷峰網(wǎng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
善惡終有報(bào),曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話(huà)”

善惡終有報(bào),曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話(huà)”

卷史
2025-05-02 13:38:20
俄軍轟炸機(jī)被炸,外國(guó)網(wǎng)友發(fā)布中國(guó)空軍基地機(jī)庫(kù):又讓俄軍羨慕了

俄軍轟炸機(jī)被炸,外國(guó)網(wǎng)友發(fā)布中國(guó)空軍基地機(jī)庫(kù):又讓俄軍羨慕了

嘆知
2025-06-02 15:07:29
金正恩心腹大將也逃不過(guò)!朝軍總政治局局長(zhǎng)軍銜被降

金正恩心腹大將也逃不過(guò)!朝軍總政治局局長(zhǎng)軍銜被降

IN朝鮮
2025-06-02 12:53:51
太難了!網(wǎng)傳河源一超市8個(gè)月的工資沒(méi)發(fā),多名員工聚集超市討薪

太難了!網(wǎng)傳河源一超市8個(gè)月的工資沒(méi)發(fā),多名員工聚集超市討薪

火山詩(shī)話(huà)
2025-06-02 11:26:31
記者:呂迪格希望留在皇馬履行完合同,和耶羅聚餐與未來(lái)無(wú)關(guān)

記者:呂迪格希望留在皇馬履行完合同,和耶羅聚餐與未來(lái)無(wú)關(guān)

懂球帝
2025-06-03 04:02:20
周杰倫和昆凌在日本京都逛街,打扮一言難盡,穿的低襠褲太丑了

周杰倫和昆凌在日本京都逛街,打扮一言難盡,穿的低襠褲太丑了

草莓解說(shuō)體育
2025-06-02 18:21:52
20歲少女影院接客,擦拭紙巾扔一地,價(jià)格曝光,一細(xì)節(jié)信息量大

20歲少女影院接客,擦拭紙巾扔一地,價(jià)格曝光,一細(xì)節(jié)信息量大

博士觀察
2025-06-01 18:33:11
曝朱芳雨醞釀大交易,CBA得分王或加盟廣東隊(duì),杜鋒愛(ài)徒確定離隊(duì)

曝朱芳雨醞釀大交易,CBA得分王或加盟廣東隊(duì),杜鋒愛(ài)徒確定離隊(duì)

幫主砍球
2025-06-02 21:47:51
朝鮮糧食如何分配?根據(jù)2025年標(biāo)準(zhǔn),朝鮮成年人每天定量700克糧

朝鮮糧食如何分配?根據(jù)2025年標(biāo)準(zhǔn),朝鮮成年人每天定量700克糧

百態(tài)人間
2025-06-02 16:25:48
山東滕州警方:在一河道內(nèi)發(fā)現(xiàn)失聯(lián)10歲男童,確認(rèn)系溺水身亡,排除刑事案件

山東滕州警方:在一河道內(nèi)發(fā)現(xiàn)失聯(lián)10歲男童,確認(rèn)系溺水身亡,排除刑事案件

環(huán)球網(wǎng)資訊
2025-06-02 21:10:31
《藏海傳》曹靜賢到死不知,他拿到假癸璽,藏海用一計(jì)算計(jì)所有人

《藏海傳》曹靜賢到死不知,他拿到假癸璽,藏海用一計(jì)算計(jì)所有人

阿訊說(shuō)天下
2025-06-02 15:23:09
法網(wǎng)最大黑馬誕生!她還是個(gè)勵(lì)志姐

法網(wǎng)最大黑馬誕生!她還是個(gè)勵(lì)志姐

極目新聞
2025-06-02 22:33:46
香港首位女優(yōu)曝《一路向西2》進(jìn)度,透露已收5位數(shù)定金

香港首位女優(yōu)曝《一路向西2》進(jìn)度,透露已收5位數(shù)定金

可樂(lè)談情感
2025-06-02 12:48:59
太難了!芯片流片成功率歷史新低:10家有8家失敗

太難了!芯片流片成功率歷史新低:10家有8家失敗

芯榜
2025-06-02 17:50:26
山東看到偵察衛(wèi)星被墜落,渤海上空藏著什么秘密讓我們?nèi)虩o(wú)可忍

山東看到偵察衛(wèi)星被墜落,渤海上空藏著什么秘密讓我們?nèi)虩o(wú)可忍

精彩V視手機(jī)臺(tái)
2025-06-02 14:15:41
李亞鵬否認(rèn)麗江項(xiàng)目失敗:開(kāi)盤(pán)就是麗江銷(xiāo)售第一,兩年賣(mài)了70個(gè)億,爛尾房是假消息

李亞鵬否認(rèn)麗江項(xiàng)目失敗:開(kāi)盤(pán)就是麗江銷(xiāo)售第一,兩年賣(mài)了70個(gè)億,爛尾房是假消息

魯中晨報(bào)
2025-06-02 20:30:03
男子借著酒勁去鄰居家,與鄰居發(fā)生關(guān)系,老婆發(fā)現(xiàn)后竟非常開(kāi)心

男子借著酒勁去鄰居家,與鄰居發(fā)生關(guān)系,老婆發(fā)現(xiàn)后竟非常開(kāi)心

罪案洞察者
2025-05-21 09:47:42
幸虧劉國(guó)梁王勵(lì)勤提前布局!乒聯(lián)鬧事和樊振東留洋,原來(lái)皆非偶然

幸虧劉國(guó)梁王勵(lì)勤提前布局!乒聯(lián)鬧事和樊振東留洋,原來(lái)皆非偶然

三十年萊斯特城球迷
2025-06-02 23:08:59
俄軍遭遇數(shù)十年來(lái)最大與最嚴(yán)重的損失

俄軍遭遇數(shù)十年來(lái)最大與最嚴(yán)重的損失

寰宇大觀察
2025-06-02 16:42:29
特朗普出現(xiàn)重大誤判!普京終于懂了:他怕的是中國(guó),不是俄羅斯

特朗普出現(xiàn)重大誤判!普京終于懂了:他怕的是中國(guó),不是俄羅斯

帝王崛起
2025-06-02 10:30:06
2025-06-03 05:04:49
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關(guān)注智能與未來(lái)!
66502文章數(shù) 655672關(guān)注度
往期回顧 全部

游戲要聞

夢(mèng)幻西游端午節(jié)活動(dòng)炸高級(jí)金蟬獸訣,這枚玉算不算物理系畢業(yè)裝?

頭條要聞

媒體:烏"奇襲"突破有核國(guó)家底線 俄應(yīng)作出最強(qiáng)烈反擊

頭條要聞

媒體:烏"奇襲"突破有核國(guó)家底線 俄應(yīng)作出最強(qiáng)烈反擊

體育要聞

傲了一輩子的恩里克,心中永遠(yuǎn)住著一個(gè)小天使

娛樂(lè)要聞

大S女兒來(lái)北京!馬筱梅帶她喝下午茶

財(cái)經(jīng)要聞

近期大火的"穩(wěn)定幣、RWA"是什么?誰(shuí)將受益?

科技要聞

下周的WWDC,蘋(píng)果AI依舊不會(huì)有“驚喜”

汽車(chē)要聞

吉利汽車(chē)5月銷(xiāo)量23.52萬(wàn)輛 同比增長(zhǎng)46%

態(tài)度原創(chuàng)

家居
旅游
親子
房產(chǎn)
手機(jī)

家居要聞

原木純白 邂逅自然本真

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

親子要聞

特意去查了一下李亞鵬的培德書(shū)院。

房產(chǎn)要聞

金地華南落子海南自貿(mào)港22萬(wàn)㎡標(biāo)桿項(xiàng)目,夯實(shí)代建行業(yè)領(lǐng)軍者地位

手機(jī)要聞

華為nova 14 Ultra評(píng)測(cè):質(zhì)感長(zhǎng)焦人像輕松捕捉

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 合作市| 日土县| 班玛县| 宁津县| 阿合奇县| 长宁区| 汉源县| 清丰县| 福海县| 河津市| 濮阳市| 汉川市| 汉源县| 宜城市| 永顺县| 夹江县| 龙里县| 玉溪市| 东源县| 泸溪县| 浦城县| 顺昌县| 孝义市| 巴林右旗| 大石桥市| 通河县| 开原市| 屯留县| 台中县| 亚东县| 万宁市| 龙岩市| 革吉县| 平阴县| 临猗县| 桂平市| 长治市| 巴青县| 十堰市| 甘南县| 南部县|