99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

讓大模型不靠外部干預(yù)自己學(xué)習(xí)!這家非Transformer AI黑馬,引爆WAIC

0
分享至


智東西
作者|程茜
編輯|漠影

智東西7月26日報道,今日,世界人工智能大會開幕,在上海一家AI創(chuàng)企的展臺前,我們目睹了中國AI創(chuàng)業(yè)公司正向著主流Transformer架構(gòu)發(fā)起強(qiáng)勢沖鋒。

一臺機(jī)器狗,學(xué)習(xí)了用戶的打招呼手勢后,不到30秒就學(xué)會并復(fù)刻了動作,且完全模仿了用戶使用右手打招呼的動作,值得注意的是,這一過程是在不依賴云端、完全離線部署的情況下實(shí)現(xiàn)的。


這正是RockAI展臺正在上演的場景。RockAI 2024年1月發(fā)布了國內(nèi)首個基于非Transformer架構(gòu)的大模型Yan 1.0、2024年9月發(fā)布Yan 1.3群體智能單元大模型,再到如今最新的Yan 2.0 Preview模型,此次機(jī)器狗亮眼表現(xiàn)的關(guān)鍵之一就是其在Yan 2.0 Preview模型中引入了記憶、自主學(xué)習(xí)能力。

3B參數(shù)規(guī)模的Yan 2.0 Preview,在ARC-C、ARC-E、WinoGrande等部分榜單上的性能表現(xiàn)已經(jīng)超過參數(shù)規(guī)模更大的Llama 3、Qwen 3、Gemma 3。


RockAI CEO劉凡平談道,Transformer架構(gòu)是先預(yù)訓(xùn)練再微調(diào)、應(yīng)用,現(xiàn)在Yan架構(gòu)模型是在物理世界中學(xué)習(xí)、交互,不需要依賴云端,打破了現(xiàn)在大模型的學(xué)習(xí)模式,Yan 2.0 Preview的出現(xiàn)就承載了模型的自主學(xué)習(xí)能力。

一、30秒離線精準(zhǔn)復(fù)刻動作,讓模型擁有“原生記憶能力”

這次在WAIC上,RockAI發(fā)布的Yan 2.0 Preview同樣是基于非Transformer架構(gòu)Yan架構(gòu),具備文本、視覺、音頻多模態(tài)理解,以及端到端音頻和文生成的能力。

話不多說,先來看效果。

基于Yan 2.0 Preview的靈巧手可以在展臺自主玩推箱子游戲,可以看到它會根據(jù)具體情況對下一步行動進(jìn)行分析、評估,最終使得箱子被放置到正確的位置。


2024年1月,Yan 1.0模型發(fā)布,擁有相較于同等參數(shù)Transformer架構(gòu)更高的訓(xùn)練推理效率、吞吐量及記憶能力,更低的機(jī)器幻覺表達(dá),同時支持CPU運(yùn)行并100%支持私有化應(yīng)用。

8個月后,進(jìn)化為多模態(tài)的群體智能單元大模型Yan 1.3發(fā)布,實(shí)現(xiàn)了多模態(tài)大模型在樹莓派的單板計(jì)算機(jī)上的部署推理。

再到如今的Yan 2.0 Preview,RockAI完成了模型基于訓(xùn)推同步的自主學(xué)習(xí)能力驗(yàn)證。

不過,目前Yan 2.0 Preview仍是RockAI在模型自主學(xué)習(xí)能力探索上的中間階段,通過可微的記憶模塊來實(shí)現(xiàn)信息的存儲、檢索和遺忘。在RockAI CTO楊華看來,讓模型具備自主學(xué)習(xí)能力可能是未來的技術(shù)壁壘,這也是其探索AGI的重要階段。

目前,行業(yè)基于Transformer架構(gòu)的大模型雖然在短期對話中表現(xiàn)出色,但仍缺乏真正意義上的“原生記憶能力”。

行業(yè)主流做法是通過RAG(檢索增強(qiáng)生成)、長上下文窗口或外部數(shù)據(jù)庫等外掛機(jī)制來模擬記憶,讓模型能夠獲取歷史信息或知識背景。然而,這種方式本質(zhì)上是一次性調(diào)用,缺乏對用戶、任務(wù)或偏好的持續(xù)性理解與積累,也難以實(shí)現(xiàn)類似人類那樣可生長、可糾偏、具備連續(xù)性的長期記憶。

而原生記憶能力是大模型邁向通用人工智能的關(guān)鍵基石,其重要性在于不僅能夠讓模型記住用戶是誰、曾經(jīng)說過什么、喜好什么,更能在長期交互中實(shí)現(xiàn)知識更新、個性化演進(jìn)與情境理解,在此基礎(chǔ)上,模型才能從工具進(jìn)化為真正的個人助手,在內(nèi)容創(chuàng)作、教育輔導(dǎo)、商業(yè)決策等用戶的實(shí)際應(yīng)用場景中提供連貫、深度智能支持。

正如前文提到的,搭載Yan 2.0 Preview的機(jī)器狗可以在現(xiàn)場30秒內(nèi)精準(zhǔn)學(xué)習(xí)并復(fù)刻指定動作,且能持續(xù)記住每位觀眾的偏好與互動風(fēng)格。其實(shí)現(xiàn)的能力不依賴云端計(jì)算,完全在離線部署環(huán)境實(shí)現(xiàn),且擁有原生記憶、自主理解與適應(yīng)能力。

離線部署Yan 2.0 preview后,機(jī)器狗擁有了成為“活著”的仿生伙伴的能力,當(dāng)大模型擁有原生記憶,終端設(shè)備被賦予了智能。


這都與RockAI“讓世界上每一臺設(shè)備擁有自己的智能”的使命一脈相承,從非Transformer架構(gòu)的模型開始,進(jìn)一步賦予其多模態(tài)、實(shí)時人機(jī)交互、自主學(xué)習(xí)的能力。

二、引入神經(jīng)網(wǎng)絡(luò)記憶單元,PC已落地

自主學(xué)習(xí)、多模態(tài)理解能力的提升,對Yan 2.0 Preview的底層架構(gòu)創(chuàng)新提出了更高要求。

Yan 2.0 Preview的核心在于,其通過可微的記憶模塊來實(shí)現(xiàn)信息的存儲、檢索和遺忘,前向過程可分為記憶更新與記憶檢索兩個階段。

其中記憶更新過程,可以使模型通過門控式更新保留長期依賴,又能基于輸入分布特性靈活整合新知識,記憶檢索過程可以在增大模型記憶容量的同時,增強(qiáng)其檢索能力。

在自主學(xué)習(xí)的基礎(chǔ)上,該模型還具備對不同模態(tài)數(shù)據(jù)的理解、生成能力,其核心組件包括基于Yan 2.0 Preview架構(gòu)的語言模型、視覺編碼器、視頻tokens壓縮模塊、視覺連接層、音頻離散化模塊和音頻解碼器。

其中,音頻離散化模塊通過將連續(xù)的語音信號量化至有限的離散值集合,提高音頻樣本的建模效率,可以做到低比特率實(shí)現(xiàn)統(tǒng)一建模語音的語義和聲音信息。

音頻模態(tài)能力擴(kuò)展方面,Yan架構(gòu)多模態(tài)模型能夠有效地學(xué)習(xí)音頻序列并建模細(xì)節(jié)聲學(xué)特征,其采用約100萬小時音頻數(shù)據(jù)進(jìn)行音頻模態(tài)擴(kuò)充與對齊訓(xùn)練,800萬對語音問答數(shù)據(jù)供音頻問答任務(wù)的有監(jiān)督微調(diào)。

最后音頻解碼階段,音頻解碼器負(fù)責(zé)將Yan架構(gòu)多模態(tài)模型生成的離散音頻Token解碼為最終的音頻波形,實(shí)現(xiàn)高質(zhì)量的端到端語音合成。

可以看出,Yan 2.0 Preview在多模態(tài)能力的各項(xiàng)底層架構(gòu)創(chuàng)新上,都在不斷突破降低計(jì)算資源、提高模型性能的邊界。

這些背后都是RockAI在非Transformer這條道路上堅(jiān)持的結(jié)果,與當(dāng)下端側(cè)模型部署的核心需求相契合。如今,RockAI的Yan系列模型已經(jīng)落地某品牌PC,并實(shí)現(xiàn)了集成大模型能力的會議助手等多項(xiàng)功能。

三、離線智能讓智能重新定義硬件,致力于實(shí)現(xiàn)群體智能

走一條非主流的底層創(chuàng)新,從一開始就注定十分艱難。RockAI自2023年6月成立,就堅(jiān)定了要做非Transformer架構(gòu),

結(jié)合技術(shù)路線的選擇與對大模型產(chǎn)業(yè)發(fā)展趨勢的判斷,在模型研發(fā)之外,RockAI在去年7月正式宣布了自己的使命,也就是“讓世界上每一臺設(shè)備都擁有自己的智能”,這也正不斷內(nèi)化到這家公司的業(yè)務(wù)發(fā)展之中。


一方面,其Yan系列模型從參數(shù)規(guī)模、性能方面逐漸契合端側(cè)設(shè)備的場景;另一方面,RockAI實(shí)現(xiàn)模型在手機(jī)、電腦、無人機(jī)、機(jī)器人等端側(cè)硬件上的離線部署,還通過內(nèi)嵌或外掛的方式,部署在大疆無人機(jī)、樹莓派單板計(jì)算機(jī)等硬件。

最先發(fā)力非Transformer架構(gòu)的RockAI,最初面對了諸多行業(yè)質(zhì)疑以及技術(shù)難點(diǎn),如這套新體系在現(xiàn)有體系上的技術(shù)復(fù)用性,以及從0到1搭建底層架構(gòu)、賦予機(jī)器自主學(xué)習(xí)能力等。

我們從RockAI的模型上看到了智能正在重新定義硬件,硬件的使用周期從一次性交付變?yōu)榱藫碛虚L期記憶,可以隨用戶一起成長。

傳統(tǒng)硬件的價值在售出瞬間達(dá)到頂峰,然后隨著磨損和過時而不斷折舊,真正的智能硬件,其核心價值是動態(tài)的,可以通過算法的迭代和模型的自學(xué)習(xí)持續(xù)提升。用戶購買的不再是一個功能固定的產(chǎn)品,而是一個能夠與自己共同成長的服務(wù)和進(jìn)化的平臺,而要實(shí)現(xiàn)這種“持續(xù)生長”的高階智能形態(tài),則更需要底層的顛覆性創(chuàng)新來支撐。

隨著Yan系列模型的發(fā)布,以及其與PC等廠商合作的不斷深入,RockAI在這條難而正確之路上的堅(jiān)持已經(jīng)初見成效。

這背后離不開其創(chuàng)始團(tuán)隊(duì)的前瞻性洞察,以及過硬的技術(shù)積累。在當(dāng)行業(yè)還沉浸在Transformer架構(gòu)帶來的技術(shù)紅利中時,RockAI察覺到該架構(gòu)在計(jì)算效率與場景適配性上的局限,并果斷入局非Transformer架構(gòu)探索。

對于未來的愿景,RockAI堅(jiān)定“群體智能”的構(gòu)想。楊華解釋道,他們設(shè)想的不是單一智能體的演化,而是構(gòu)建一個由多個模型和終端組成的“機(jī)器社會”,如同人類社會般實(shí)現(xiàn)群策群力與高度協(xié)作。在這個體系中,每一個智能終端不僅具備環(huán)境感知能力,還能與物理世界實(shí)時交互、自主學(xué)習(xí)與進(jìn)化,共同構(gòu)成一個有機(jī)協(xié)同、持續(xù)成長的智能群體。

“群體智能”不僅是技術(shù)的躍遷,也是RockAI認(rèn)為邁向通用人工智能的關(guān)鍵路徑。Yan 2.0 Preview的發(fā)布與在終端設(shè)備的落地,或許很快能讓我們看到其這一愿景的雛形。

結(jié)語堅(jiān)守非Transformer架構(gòu)之路讓每臺設(shè)備都擁有智能

面對主流Transformer架構(gòu),不盲目追隨這一浪潮,而是堅(jiān)持自主創(chuàng)新,探索更貼近真實(shí)智能本質(zhì)的技術(shù)路線,并以實(shí)際行動探索非Transformer架構(gòu)的創(chuàng)新可能,是當(dāng)下AI產(chǎn)業(yè)發(fā)展中最為可貴的。

RockAI當(dāng)下取得的成果固然重要,但其基于對產(chǎn)業(yè)痛點(diǎn)的深刻洞察,為AI技術(shù)多元發(fā)展注入活力,從底層邏輯出發(fā)解決實(shí)際問題的舉措,正推動AI產(chǎn)業(yè)從對技術(shù)紅利的依賴走向真正的創(chuàng)新突破。

Yan 2.0 Preview展示的不僅是一次技術(shù)范式的突破,更是我們對未來人機(jī)關(guān)系的思考:不是遙不可及的超級模型,而是每一個設(shè)備都能思考、協(xié)作和成長的智能新時代。

“讓世界上每一臺設(shè)備擁有自己的智能”是RockAI的使命,這已經(jīng)在其成立初期的技術(shù)路線選擇、創(chuàng)新布局中充分展現(xiàn)出來,并且在當(dāng)下取得階段性成果。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
硬氣!國防部發(fā)布新規(guī),明確授權(quán)解放軍在警告無效時可直接開火

硬氣!國防部發(fā)布新規(guī),明確授權(quán)解放軍在警告無效時可直接開火

大道無形我有型
2025-07-23 13:32:43
老友記“錢德勒”的馬修·派瑞溺亡案大反轉(zhuǎn)!不是意外是謀殺?

老友記“錢德勒”的馬修·派瑞溺亡案大反轉(zhuǎn)!不是意外是謀殺?

聽風(fēng)聽你
2025-07-26 10:29:57
北上廣深中考落幕,國際學(xué)校迎來至暗時刻

北上廣深中考落幕,國際學(xué)校迎來至暗時刻

閱讀第一
2025-07-26 08:36:39
雷達(dá)貼膜、數(shù)據(jù)打臉、央視抽身:懂車帝測試,水有多深?

雷達(dá)貼膜、數(shù)據(jù)打臉、央視抽身:懂車帝測試,水有多深?

大白聊IT
2025-07-26 11:51:46
不可復(fù)制的風(fēng)流

不可復(fù)制的風(fēng)流

深度報
2025-07-24 10:44:05
廣西某設(shè)計(jì)院被一鍋端!

廣西某設(shè)計(jì)院被一鍋端!

黯泉
2025-07-26 20:44:33
6名溺亡學(xué)生的家屬已到事發(fā)地,家屬發(fā)聲:見到墜亡浮選槽的孩子

6名溺亡學(xué)生的家屬已到事發(fā)地,家屬發(fā)聲:見到墜亡浮選槽的孩子

大笑江湖史
2025-07-27 00:52:12
心理學(xué)家發(fā)現(xiàn):飯量大的人,比飯量小的人,情商要高出90%

心理學(xué)家發(fā)現(xiàn):飯量大的人,比飯量小的人,情商要高出90%

第一心理
2025-07-26 17:08:13
正部長級王受文,有新職

正部長級王受文,有新職

揚(yáng)子晚報
2025-07-26 20:26:58
用AI生成爛榴蓮圖,騙“僅退款”!這操作太離譜了……

用AI生成爛榴蓮圖,騙“僅退款”!這操作太離譜了……

躺倒鴨
2025-07-25 13:52:03
柬埔寨要求立即無條件停火,泰國回應(yīng)

柬埔寨要求立即無條件停火,泰國回應(yīng)

參考消息
2025-07-26 13:49:05
美企高管被限制離華,美國強(qiáng)硬回應(yīng):立刻放人,特朗普祭出殺手锏

美企高管被限制離華,美國強(qiáng)硬回應(yīng):立刻放人,特朗普祭出殺手锏

風(fēng)城春史
2025-07-27 02:20:03
6名大學(xué)生溺亡事件更多細(xì)節(jié)披露 車間主任:校企都沒做過專項(xiàng)安全檢查

6名大學(xué)生溺亡事件更多細(xì)節(jié)披露 車間主任:校企都沒做過專項(xiàng)安全檢查

上游新聞
2025-07-25 14:32:26
小豌豆遭口誅筆伐:他應(yīng)該立刻退役,否則未來他就會被足球拋棄

小豌豆遭口誅筆伐:他應(yīng)該立刻退役,否則未來他就會被足球拋棄

雷速體育
2025-07-26 10:24:13
網(wǎng)友熱議:你絕對想不到外國人眼中的我們說英語的樣子!

網(wǎng)友熱議:你絕對想不到外國人眼中的我們說英語的樣子!

特約前排觀眾
2025-07-27 00:10:05
在健身房,被惡心到了。

在健身房,被惡心到了。

健身迷
2025-07-02 00:21:44
外資大廠,全面退出中國市場!

外資大廠,全面退出中國市場!

感知芯視界
2025-07-24 16:17:21
一個月前,任誰都想不到他會塌房?

一個月前,任誰都想不到他會塌房?

橘子娛樂
2025-07-25 17:34:44
13年前,那個當(dāng)著全世界喝下核污染水的日本官員,后來怎么樣了?

13年前,那個當(dāng)著全世界喝下核污染水的日本官員,后來怎么樣了?

浩舞默畫
2025-07-26 09:21:29
利空突襲!暴跌33%!

利空突襲!暴跌33%!

證券時報
2025-07-26 08:17:06
2025-07-27 03:35:01
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
10205文章數(shù) 116807關(guān)注度
往期回顧 全部

科技要聞

AI教父辛頓現(xiàn)身上海:人類如何不被AI殺掉

頭條要聞

佩通坦再發(fā)聲:雖無法履行總理職責(zé) 但一直在聽取匯報

頭條要聞

佩通坦再發(fā)聲:雖無法履行總理職責(zé) 但一直在聽取匯報

體育要聞

楊瀚森效力NBA期間 青島男籃將暫存球隊(duì)15號球衣

娛樂要聞

董璇首談保釋前夫細(xì)節(jié)!高云翔突然不回消息

財(cái)經(jīng)要聞

劉煜輝:當(dāng)下重要不是找確定性而是轉(zhuǎn)折點(diǎn)

汽車要聞

"得房率"超90% 全新嵐圖知音空間信息曝光

態(tài)度原創(chuàng)

旅游
時尚
教育
本地
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

金童玉女離婚20年,怎么不算圓滿大結(jié)局呢?

教育要聞

南陽市十三中(3校區(qū))、實(shí)驗(yàn)中學(xué)、二十二中招生公告匯總

本地新聞

換個城市過夏天|風(fēng)拂鹽湖,躲進(jìn)格爾木的盛夏清涼

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 莫力| 宁远县| 和政县| 塘沽区| 吉林省| 万州区| 韶关市| 昭苏县| 梅州市| 永靖县| 永和县| 郧西县| 乃东县| 高邑县| 延寿县| 屏山县| 页游| 怀远县| 恩平市| 陆河县| 双峰县| 锦屏县| 贵德县| 乐亭县| 锡林浩特市| 黑山县| 闸北区| 宝应县| 梅河口市| 景德镇市| 垫江县| 陆川县| 南陵县| 辛集市| 宁陕县| 昌宁县| 连平县| 穆棱市| 琼结县| 广饶县| 莎车县|