99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

智駕公司下場搞AI視頻生成,模型上線即開源

0
分享至

AI好好用報(bào)道

編輯:楊文

人人免費(fèi)可用。

大洋彼岸,兩大巨頭 OpenAI 和谷歌輪番炸場。

一個(gè)發(fā)布了那個(gè)傳說中的 Sora,一個(gè)推出了最強(qiáng)視頻生成模型 Veo2。

不過,每月 200 美金的 Sora 上線即翻車,而好評(píng)不斷的 Veo 2 則尚未對公眾開放。


與他們相比,國內(nèi)這家視頻大模型公司顯得尤為豪橫,直接大手一揮,將自家模型開源了。

12 月 17 日,圖森未來發(fā)布了一款圖生視頻的開源大模型,名字很中國風(fēng),叫 Ruyi(如意)。

同時(shí),他們還將 Ruyi-Mini-7B 版本正式開源,網(wǎng)友們現(xiàn)在就可以去 Hugging Face 上下載使用。


  • Hugging Face 模型鏈接:

https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

  • GitHub 代碼鏈接:

https://github.com/IamCreateAI/Ruyi-Models

為了讓網(wǎng)友們能夠快速上手,他們還提供了部署說明和 ComfyUI 工作流,網(wǎng)友只需在消費(fèi)級(jí)顯卡(例如 RTX 4090)上運(yùn)行即可。

不要錢就能上手玩,Ruyi 效果究竟如何?我們先放幾個(gè)官方 demo。

頭戴耳機(jī)的女孩眼神自然流轉(zhuǎn):


宇航員漫步在荒涼的月球:


還有忽閃著大眼睛的動(dòng)漫角色:


以及海浪拍打著礁石:


看著效果還挺 OK,接下來我們親自上手評(píng)測一番。

一張圖片直出 5 秒視頻

Ruyi 是圖森未來正式發(fā)布的第一款「圖生視頻」模型。

無需輸入提示詞,只要上傳一張圖片,Ruyi 就能生成一段最高分辨率 720P、時(shí)長 5 秒的視頻。

它支持任意長寬比,會(huì)根據(jù)「喂」給它的圖片生成相應(yīng)尺寸的視頻。


(動(dòng)圖:16:9 尺寸)

(動(dòng)圖:9:16 尺寸)

Ruyi 還支持最多 5 個(gè)起始幀、最多 5 個(gè)結(jié)束幀基礎(chǔ)上的視頻生成,通過循環(huán)疊加可以生成任意長度的視頻。


此外,Ruyi 提供了 4 檔運(yùn)動(dòng)幅度控制,方便創(chuàng)作者對整體畫面的變化程度進(jìn)行控制。


以及上、下、左、右、靜止 5 種鏡頭控制。


接下來,我們將從寫實(shí)風(fēng)格、影視劇照、動(dòng)畫風(fēng)格、動(dòng)物、風(fēng)景等 5 個(gè)維度進(jìn)行測評(píng)。

寫實(shí)風(fēng)格

寫實(shí)風(fēng)格是評(píng)價(jià)視頻生成模型性能的關(guān)鍵指標(biāo)之一。

這是因?yàn)樗竽P湍軌蚓珳?zhǔn)捕捉并再現(xiàn)現(xiàn)實(shí)世界中的細(xì)節(jié),包括人物面部表情、光影效果、物體材質(zhì)等。

我們先上傳了一張 AI 生成的寫實(shí)人物圖片,再讓 Ruyi 將其轉(zhuǎn)為視頻。


視頻中,金發(fā)女郎微微抬頭并輕晃身體,形象保持了一致性,面部表情也沒崩。


我們又丟給它一張韓國影星金敏喜的真人照片,在生成的 3 秒視頻中,Ruyi 對于人物面部識(shí)別和細(xì)節(jié)拿捏得還挺到位。


影視劇照

我們再來看看 Ruyi「拍」電影鏡頭的水平。

在 Ruyi 一頓操作下,《老友記》中身著紅衣的莫妮卡似乎在和某人進(jìn)行對話。

畫面色彩豐富,很有美感,動(dòng)作幅度也較大。


還有《公主日記》中的安妮?海瑟薇,如果不加以說明,Ruyi 生成的視頻甚至能「以假亂真」。


動(dòng)畫風(fēng)格

與其他模型類似,Ruyi 還很擅長生成動(dòng)畫卡通風(fēng)格的視頻。

比如這只皮克斯風(fēng)格的臘腸犬,眼神凌厲,搖頭晃腦:


還有卡通風(fēng)格的擬人小兔,邁著八字步緩緩走來,雖然運(yùn)動(dòng)幅度較大,但畫面很穩(wěn)定,動(dòng)作流暢絲滑。


動(dòng)物

僅需一張小狗的圖片,連提示詞都省了,Ruyi 就能讓靜態(tài)的小狗變得活靈活現(xiàn)。


在下面這則小貓的生成視頻中,扭頭動(dòng)作倒也連貫逼真。

風(fēng)景

水流的動(dòng)態(tài)涉及到流體動(dòng)力學(xué)的原理,AI 模型需要能夠理解和模擬水流的運(yùn)動(dòng),包括水流的速度、方向等。

Ruyi 呈現(xiàn)了一個(gè)微風(fēng)吹過,湖面泛起陣陣漣漪的畫面。其細(xì)節(jié)之處在于水波的紋理、陽光照在水面的光影以及水流與巖石碰撞時(shí)產(chǎn)生的回流。


下面這則視頻是 Ruyi 模擬攝像機(jī)緩慢推進(jìn)鏡頭的場景。

畫面沿著馬路向前延伸,遠(yuǎn)處的行道樹逐漸逼近,很有紀(jì)錄片的感覺。

總體來看,Ruyi 的圖生視頻在畫面一致性、動(dòng)作流暢性以及真實(shí)性上表現(xiàn)還不錯(cuò),不過仍存在手部畸形、多人時(shí)面部細(xì)節(jié)崩壞、不可控轉(zhuǎn)場等問題。

智駕公司「半路出家」搞生成式 AI

實(shí)際上,圖森未來曾是一家正兒八經(jīng)的智能駕駛公司。

不過今年 8 月 15 日,這家公司突然宣布進(jìn)軍動(dòng)畫與視頻游戲市場,并成立「生成式 AI」新業(yè)務(wù)部門。

據(jù)官方稱,此舉是為了充分利用圖森在自動(dòng)駕駛領(lǐng)域的技術(shù)積累,探索下一個(gè)商業(yè)化機(jī)會(huì)。

該公司認(rèn)為,他們在自動(dòng)駕駛領(lǐng)域的技術(shù)優(yōu)勢可以轉(zhuǎn)化為 AI 生成領(lǐng)域的競爭力,做自動(dòng)駕駛時(shí)所積累的 AI 基礎(chǔ)設(shè)施和工具、大規(guī)模數(shù)據(jù)處理能力以及模型訓(xùn)練優(yōu)化經(jīng)驗(yàn)等可以直接轉(zhuǎn)換到大模型訓(xùn)練上。

而最佳應(yīng)用場景又是孵化生成式 AI 工具的原動(dòng)力,于是他們盯上了動(dòng)漫和游戲產(chǎn)業(yè),試圖利用大模型降低動(dòng)漫和游戲內(nèi)容的開發(fā)周期和開發(fā)成本。

短短 4 個(gè)月時(shí)間,圖森就搞出了圖生視頻模型 Ruyi。

除了模型開源外,圖生未來研發(fā)團(tuán)隊(duì)還揭秘了背后的模型架構(gòu)和訓(xùn)練方式。

作為 Sora 的「幕后功臣」,DiT 架構(gòu)在近幾年逐漸流行起來。

Ruyi 也是一個(gè)基于 DiT 架構(gòu)的圖生視頻模型。它由兩部分構(gòu)成:一個(gè) Casual VAE 模塊負(fù)責(zé)視頻數(shù)據(jù)的壓縮和解壓,一個(gè) Diffusion Transformer 負(fù)責(zé)壓縮后的視頻生成。

其中 Casual VAE 模塊會(huì)將空間分辨率壓縮至 1/8,時(shí)間分辨率壓縮至 1/4,壓縮后每個(gè)像素由 16 位的 BF16 進(jìn)行表示。

DiT 部分使用 3D full attention,在空間上使用 2D RoPE 進(jìn)行位置編碼,時(shí)間上使用 sin_cos 進(jìn)行位置編碼,最終的 loss 選用了 DDPM 進(jìn)行訓(xùn)練。

模型的總參數(shù)量約為 7.1B,使用了約 200M 個(gè)視頻片段進(jìn)行訓(xùn)練。

雖然與其他視頻生成模型相比,Ruyi 發(fā)布似乎慢了一拍,功能也相對單一,但畢竟目前開源免費(fèi)。

對于后續(xù)的技術(shù)路線和功能升級(jí),圖森未來也有規(guī)劃。

他們將在 2025 年推出 Ruyi Standard 閉源模型和一系列 ACG-GEN 工具,滿足專業(yè)內(nèi)容制作團(tuán)隊(duì)的需求。


(ACG 是英文「Anime,Comics and Games」詞組的縮寫,意為動(dòng)畫、漫畫和游戲)

到 2026 年則發(fā)布最強(qiáng)性能版本,支持強(qiáng)大語義理解能力和多條件可控生成。


對此,你有什么看法?來評(píng)論區(qū)聊聊吧。

? THE END

轉(zhuǎn)載請聯(lián)系本公眾號(hào)獲得授權(quán)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
河北保定蠡縣縣委書記陳偉已跨市調(diào)任廊坊三河市委書記

河北保定蠡縣縣委書記陳偉已跨市調(diào)任廊坊三河市委書記

澎湃新聞
2025-05-30 10:42:27
朝鮮召開軍委擴(kuò)大會(huì)議,金正恩頭發(fā)白了!

朝鮮召開軍委擴(kuò)大會(huì)議,金正恩頭發(fā)白了!

IN朝鮮
2025-05-30 09:43:45
37歲迪馬利亞落葉歸根:闖蕩歐洲18年30冠!足協(xié)主席歡迎

37歲迪馬利亞落葉歸根:闖蕩歐洲18年30冠!足協(xié)主席歡迎

葉青足球世界
2025-05-30 08:05:44
5月29日俄烏最新:史上最大的泄密事件

5月29日俄烏最新:史上最大的泄密事件

西樓飲月
2025-05-29 17:36:24
公園“司馬光砸缸”雕塑被吐槽像猴

公園“司馬光砸缸”雕塑被吐槽像猴

大象新聞
2025-05-29 10:34:01
寧夏銀川富洋燒烤店“6·21”特別重大燃?xì)獗ㄊ鹿噬嫘淌掳讣粚徯?>
    </a>
        <h3>
      <a href=新京報(bào)
2025-05-30 10:40:02
天津夫妻省吃儉用供兒留學(xué),歸國后,兒子的一番話讓他們一夜白頭

天津夫妻省吃儉用供兒留學(xué),歸國后,兒子的一番話讓他們一夜白頭

阿坷敘故事
2025-05-15 22:22:33
真當(dāng)中國不敢動(dòng)手?中方向全世界宣布:退出1900億大項(xiàng)目

真當(dāng)中國不敢動(dòng)手?中方向全世界宣布:退出1900億大項(xiàng)目

阿傖說事
2025-05-30 09:20:58
小米Q1財(cái)報(bào)發(fā)布!收入、盈利均創(chuàng)歷史新高!小米SU7系列交付新車75869輛,研發(fā)支出增長30%

小米Q1財(cái)報(bào)發(fā)布!收入、盈利均創(chuàng)歷史新高!小米SU7系列交付新車75869輛,研發(fā)支出增長30%

每日經(jīng)濟(jì)新聞
2025-05-27 18:06:52
又一個(gè)體育大IP誕生了:江蘇城市足球聯(lián)賽,比中超足球聯(lián)賽更精彩

又一個(gè)體育大IP誕生了:江蘇城市足球聯(lián)賽,比中超足球聯(lián)賽更精彩

總在茶余后
2025-05-29 11:32:20
美國不想留,內(nèi)地企業(yè)家不想要,被扣上“間諜帽子”的中國留學(xué)生太難了!

美國不想留,內(nèi)地企業(yè)家不想要,被扣上“間諜帽子”的中國留學(xué)生太難了!

西游日記
2025-05-30 10:52:59
拒絕出局!布倫森連造2+1和3+1 單節(jié)狂轟16分 32+5+5打爆哈利伯頓

拒絕出局!布倫森連造2+1和3+1 單節(jié)狂轟16分 32+5+5打爆哈利伯頓

狍子歪解體壇
2025-05-30 10:37:24
突發(fā)!東契奇給湖人下72小時(shí)通牒:不簽2018年?duì)钤删蜕暾埥灰祝?>
    </a>
        <h3>
      <a href=埃文凱爾
2025-05-30 00:19:17
新四軍女兵莫林被俘,她已做好赴死準(zhǔn)備,哪知日軍卻問:莫林在哪

新四軍女兵莫林被俘,她已做好赴死準(zhǔn)備,哪知日軍卻問:莫林在哪

冰點(diǎn)歷史
2025-05-29 09:38:03
江蘇婚禮婆婆搶風(fēng)頭,表演倒立露底褲,新娘黑臉:為老不尊

江蘇婚禮婆婆搶風(fēng)頭,表演倒立露底褲,新娘黑臉:為老不尊

農(nóng)村情感故事
2025-05-29 17:42:14
中紀(jì)委晚間打虎!今年第5個(gè)正部級(jí)老虎被查,7年前曾引咎辭職

中紀(jì)委晚間打虎!今年第5個(gè)正部級(jí)老虎被查,7年前曾引咎辭職

上觀新聞
2025-05-29 21:37:19
美國展出唐伯虎10米真跡,估值超過100億,不愧是“頂級(jí)才子”!

美國展出唐伯虎10米真跡,估值超過100億,不愧是“頂級(jí)才子”!

書法網(wǎng)
2025-05-29 18:14:37
放假通知!中小學(xué)2025暑假放假時(shí)間確定了,家長卻表示難以接受

放假通知!中小學(xué)2025暑假放假時(shí)間確定了,家長卻表示難以接受

戶外阿毽
2025-05-30 01:32:19
美國終于動(dòng)手,27萬中國學(xué)生,將被陸續(xù)遣返,中方警告兩大后果

美國終于動(dòng)手,27萬中國學(xué)生,將被陸續(xù)遣返,中方警告兩大后果

阿傖說事
2025-05-29 16:03:16
央視報(bào)道中國殲20去年在東海上空對抗2架日本F35戰(zhàn)機(jī)的情況,

央視報(bào)道中國殲20去年在東海上空對抗2架日本F35戰(zhàn)機(jī)的情況,

老友科普
2025-05-29 22:52:47
2025-05-30 11:47:00
AI好好用 incentive-icons
AI好好用
探索人工智能應(yīng)用場景及商業(yè)化
2096文章數(shù) 4432關(guān)注度
往期回顧 全部

科技要聞

榮耀新CEO放話:下半年重返前三,靠譜嗎?

頭條要聞

女廳官被"雙開":曾花4000萬買別墅 850萬裝修極盡奢華

頭條要聞

女廳官被"雙開":曾花4000萬買別墅 850萬裝修極盡奢華

體育要聞

當(dāng)我終于回國時(shí),可能已認(rèn)不出我的家

娛樂要聞

央視主持人朱迅在景區(qū)救治高反游客

財(cái)經(jīng)要聞

美國政府殺瘋了,全世界目瞪口呆

汽車要聞

約合人民幣47.10萬元起 阿維塔11在香港上市

態(tài)度原創(chuàng)

健康
旅游
本地
手機(jī)
軍事航空

唇皰疹和口腔潰瘍是"同伙"嗎?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

手機(jī)要聞

2699元起!華為nova 14今日首銷:麒麟8000+鴻蒙5

軍事要聞

以軍承認(rèn)使用激光武器攔截?zé)o人機(jī)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 高唐县| 武隆县| 北票市| 仪征市| 泾川县| 福安市| 八宿县| 通辽市| 远安县| 麟游县| 青神县| 延庆县| 高邮市| 武穴市| 文山县| 崇礼县| 昌邑市| 从江县| 福海县| 内丘县| 黄浦区| 江阴市| 平泉县| 镇宁| 垣曲县| 萍乡市| 仙桃市| 资阳市| 平塘县| 鄂州市| 集安市| 吴江市| 滦南县| 井研县| 平南县| 东莞市| 新丰县| 平原县| 高清| 织金县| 孝昌县|