99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

多模態(tài)干翻天了

0
分享至

大家好,我是 i 學(xué)習(xí)的老章

最近 Qwen3 發(fā)布、DeepSeek-R2 也傳言即將發(fā)布,十分熱鬧。其實(shí)多模態(tài)方面,最近也非常熱鬧,只是熱度很一般。

本文,老章會近期發(fā)布的幾個多模態(tài)大模型做個梳理

感興趣的部分,大家可以深入看看

1、Magi-1 視頻生成大模型,推理成本低到后腳跟



Magi-1,首個實(shí)現(xiàn)頂級畫質(zhì)輸出的自回歸視頻生成模型模型權(quán)重、代碼 100% 開源。此次開源了從 24B 到 4.5B 參數(shù)的一系列模型,最低配置一塊 4090 就能跑。

在線試玩:https://sand.ai/

項(xiàng)目地址:https://github.com/SandAI-org/MAGI-1

論文地址:https://static.magi.world/static/files/MAGI_1.pdf

模型文件:https://huggingface.co/sand-ai/MAGI-1/tree/main/ckpt/magi/

詳細(xì)介紹:

2、基于 Qwen2.5 架構(gòu)直出語音編碼

基于 Qwen2.5 架構(gòu)直出語音編碼,零樣本復(fù)刻任意人聲,中英文混合生成絲滑無界。無需專業(yè)設(shè)備/海量數(shù)據(jù),即刻生成媲美真人的多語言語音。

項(xiàng)目:https://github.com/SparkAudio/Spark-TTS

論文:https://www.arxiv.org/abs/2503.01710

Demo:https://sparkaudio.github.io/spark-tts/

3、阿里視頻生成大模型 Wan2.1

Wan-AI 發(fā)布的 140 億參數(shù)的大型模型,用于 First-Last-Frame 到視頻生成。該模型能夠生成 5 秒鐘 720p 高清視頻,并因其創(chuàng)新方法而備受關(guān)注。它于 2025 年 4 月發(fā)布,并附帶推理代碼和權(quán)重。

項(xiàng)目:https://github.com/Wan-Video/Wan2.1

模型文件:https://modelscope.cn/organization/Wan-AI

技術(shù)文件:https://arxiv.org/abs/2503.20314

4、騰訊混元視頻生成

不算新模型了,看到一個最近的項(xiàng)目是基于騰訊混元,才發(fā)現(xiàn)騰訊在這方面也有干貨

FramePack 是一種漸進(jìn)式生成視頻的下一幀預(yù)測神經(jīng)網(wǎng)絡(luò)架構(gòu),通過將輸入上下文壓縮至恒定長度,使生成工作量與視頻時長無關(guān)。該架構(gòu)即便在筆記本電腦 GPU 上,也能用 130 億參數(shù)模型處理超長幀序列。

Project Page:https://lllyasviel.github.io/frame_pack_gitpage/

Paper:https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf

Code:https://github.com/lllyasviel/FramePack?tab=readme-ov-file

混元圖像轉(zhuǎn)視頻模型(基于混元視頻的可定制圖像轉(zhuǎn)視頻模型):https://github.com/Tencent/HunyuanVideo-I2V

混元大型視頻生成模型的系統(tǒng)框架:https://github.com/Tencent/HunyuanVideo

模型文件:https://huggingface.co/tencent/HunyuanVideo

官方介紹+Demo:https://aivideo.hunyuan.tencent.com/

然后還發(fā)現(xiàn)騰訊還有 3D 視頻大模型

官網(wǎng):https://3d.hunyuan.tencent.com/

3D 模型文件:https://huggingface.co/tencent/Hunyuan3D-2

在線試玩:https://huggingface.co/spaces/tencent/Hunyuan3D-2

5、文本到圖像模型

HiDream-I1是一款全新的開源圖像生成基礎(chǔ)模型,擁有 170 億參數(shù),能在數(shù)秒內(nèi)實(shí)現(xiàn)頂尖的圖像生成質(zhì)量。HiDream-ai/HiDream-I1-Full: 文本到圖像模型,HiDream 的新模型,生成質(zhì)量非常好

試玩:https://vivago.ai/home

GitHubhttps://github.com/HiDream-ai/HiDream-I1

模型文件:https://huggingface.co/spaces/HiDream-ai/HiDream-E1-Full

6、阿里 Qwen2.5-VL

也不算新,最近有模型更新

阿里開源的旗艦視覺語言模型,在視覺理解方面表現(xiàn)出色,能夠識別常見物體,分析圖像中的文本、圖表等元素。在視頻處理上,Qwen2.5-VL 能夠理解超過 1 小時的長視頻,精準(zhǔn)定位相關(guān)片段捕捉事件。模型還支持發(fā)票、表單等數(shù)據(jù)的結(jié)構(gòu)化輸出。

部署教程:

模型文件:https://modelscope.cn/models/Qwen/Qwen2.5-VL-7B-Instruct/files

技術(shù)文件:https://qwenlm.github.io/blog/qwen2.5-vl/

項(xiàng)目地址:https://github.com/QwenLM/Qwen2.5-VL

最后再推薦一個我正在學(xué)習(xí)的課程:



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!300849,被證監(jiān)會立案!

突發(fā)!300849,被證監(jiān)會立案!

新浪財經(jīng)
2025-06-27 20:09:47
2025養(yǎng)老金調(diào)整無進(jìn)展,人社部卻連發(fā)三條動態(tài),真令人浮想聯(lián)翩

2025養(yǎng)老金調(diào)整無進(jìn)展,人社部卻連發(fā)三條動態(tài),真令人浮想聯(lián)翩

社保精算師
2025-06-27 17:33:19
老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

大千世界觀
2025-05-22 16:57:05
42歲技術(shù)總監(jiān)被辭僅得8萬,秒退所有工作群,次日217個未接來電

42歲技術(shù)總監(jiān)被辭僅得8萬,秒退所有工作群,次日217個未接來電

磊子講史
2025-06-21 16:39:29
83歲蔡瀾去世!遺體已火化,生前住酒店無兒無女,四大才子全離世

83歲蔡瀾去世!遺體已火化,生前住酒店無兒無女,四大才子全離世

萌神木木
2025-06-27 16:02:42
央視暗訪,這些網(wǎng)紅醫(yī)生被曝光

央視暗訪,這些網(wǎng)紅醫(yī)生被曝光

新浪財經(jīng)
2025-06-27 14:31:53
愛沙尼亞準(zhǔn)備接收可搭載核武器戰(zhàn)機(jī),克宮:對俄構(gòu)成直接威脅

愛沙尼亞準(zhǔn)備接收可搭載核武器戰(zhàn)機(jī),克宮:對俄構(gòu)成直接威脅

界面新聞
2025-06-27 20:04:56
董軍防長給足面子,印度防長仍拒簽聯(lián)合聲明,但對華作出罕見承諾

董軍防長給足面子,印度防長仍拒簽聯(lián)合聲明,但對華作出罕見承諾

愛史紀(jì)
2025-06-27 12:15:58
民航局發(fā)緊急通知,大量充電寶被丟棄在機(jī)場,有無這個標(biāo)識是關(guān)鍵

民航局發(fā)緊急通知,大量充電寶被丟棄在機(jī)場,有無這個標(biāo)識是關(guān)鍵

市井覓食記
2025-06-27 13:57:24
從特工偷拍渣土車到突襲成功:美軍花了15年才摸清伊朗核設(shè)施情況

從特工偷拍渣土車到突襲成功:美軍花了15年才摸清伊朗核設(shè)施情況

湊近看世界
2025-06-27 07:00:14
葛斯齊曝汪小菲和S媽的聊天記錄是S媽給他爆料的,網(wǎng)友:騙傻子?

葛斯齊曝汪小菲和S媽的聊天記錄是S媽給他爆料的,網(wǎng)友:騙傻子?

心靜物娛
2025-06-27 10:09:02
已確認(rèn)!是知名演員胡歌

已確認(rèn)!是知名演員胡歌

FM93浙江交通之聲
2025-06-26 15:06:45
楊瀚森將在開拓者穿16號,球衣已在官方商店上架,售價140美元起

楊瀚森將在開拓者穿16號,球衣已在官方商店上架,售價140美元起

懂球帝
2025-06-27 14:23:14
熊磊要搬出許敏萬達(dá)的房子了!這還不是結(jié)尾, 許敏還將繼續(xù)上告

熊磊要搬出許敏萬達(dá)的房子了!這還不是結(jié)尾, 許敏還將繼續(xù)上告

魔都姐姐雜談
2025-06-27 11:32:04
明星老了不忍直視!鞠萍一臉兇相,任達(dá)華干瘦蠟黃,郭達(dá)長老年斑

明星老了不忍直視!鞠萍一臉兇相,任達(dá)華干瘦蠟黃,郭達(dá)長老年斑

洲洲影視娛評
2025-05-20 21:05:49
曝小米總監(jiān)出軌200多人,6個私生子拍多張親密照,還有美女高中生

曝小米總監(jiān)出軌200多人,6個私生子拍多張親密照,還有美女高中生

壹月情感
2025-06-26 22:26:40
自取滅亡的立陶宛,想讓中國妥協(xié)?中國這回真的沒手軟

自取滅亡的立陶宛,想讓中國妥協(xié)?中國這回真的沒手軟

任紀(jì)煙
2025-05-31 06:49:20
美國終明白擺脫不了稀土卡脖子,中方下命令:稀土專家上交護(hù)照

美國終明白擺脫不了稀土卡脖子,中方下命令:稀土專家上交護(hù)照

深析古今
2025-06-27 10:05:55
孩子吹空調(diào)26°最好?兒科醫(yī)生:錯,想要娃不生病,得開這個溫度

孩子吹空調(diào)26°最好?兒科醫(yī)生:錯,想要娃不生病,得開這個溫度

河山銳新聞
2025-06-23 13:53:16
這女人,果然是妖精

這女人,果然是妖精

妮妮玩不夠
2025-06-26 12:19:47
2025-06-27 21:39:00
機(jī)器學(xué)習(xí)與Python社區(qū) incentive-icons
機(jī)器學(xué)習(xí)與Python社區(qū)
機(jī)器學(xué)習(xí)算法與Python
3014文章數(shù) 11024關(guān)注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設(shè)施后 美軍一將領(lǐng)進(jìn)入特朗普核心圈

頭條要聞

美國打擊伊朗核設(shè)施后 美軍一將領(lǐng)進(jìn)入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經(jīng)要聞

合新鐵路建設(shè)材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務(wù)艙售22.99萬

態(tài)度原創(chuàng)

健康
教育
數(shù)碼
時尚
軍事航空

呼吸科專家破解呼吸道九大謠言!

教育要聞

昌平感知覺統(tǒng)合培訓(xùn)班結(jié)業(yè)式暨鞏華中心小學(xué)一體化生態(tài)課間研討會

數(shù)碼要聞

極摩客 EVO-X2 AI 桌面主機(jī)圖賞:輕巧緊湊,銳龍AI Max+ 395加持

到了夏天,中年女人穿過膝裙不配運(yùn)動鞋,才能美得優(yōu)雅又得體

軍事要聞

美媒揭美軍37小時奔襲伊朗細(xì)節(jié)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 东明县| 新郑市| 文山县| 崇信县| 当阳市| 新乐市| 福泉市| 外汇| 南昌县| 昭通市| 兴化市| 娄底市| 且末县| 阳城县| 双城市| 成武县| 永修县| 东乡县| 彭山县| 日土县| 哈巴河县| 常山县| 凌海市| 潞城市| 达拉特旗| 通化市| 洮南市| 东乌| 海城市| 辉南县| 拉孜县| 弥渡县| 定结县| 京山县| 武陟县| 衡阳县| 开封市| 呼图壁县| 延津县| 长乐市| 永年县|