99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

多模態(tài)干翻天了

0
分享至

大家好,我是 i 學習的老章

最近 Qwen3 發(fā)布、DeepSeek-R2 也傳言即將發(fā)布,十分熱鬧。其實多模態(tài)方面,最近也非常熱鬧,只是熱度很一般。

本文,老章會近期發(fā)布的幾個多模態(tài)大模型做個梳理

感興趣的部分,大家可以深入看看

1、Magi-1 視頻生成大模型,推理成本低到后腳跟



Magi-1,首個實現(xiàn)頂級畫質(zhì)輸出的自回歸視頻生成模型模型權(quán)重、代碼 100% 開源。此次開源了從 24B 到 4.5B 參數(shù)的一系列模型,最低配置一塊 4090 就能跑。

在線試玩:https://sand.ai/

項目地址:https://github.com/SandAI-org/MAGI-1

論文地址:https://static.magi.world/static/files/MAGI_1.pdf

模型文件:https://huggingface.co/sand-ai/MAGI-1/tree/main/ckpt/magi/

詳細介紹:

2、基于 Qwen2.5 架構(gòu)直出語音編碼

基于 Qwen2.5 架構(gòu)直出語音編碼,零樣本復刻任意人聲,中英文混合生成絲滑無界。無需專業(yè)設(shè)備/海量數(shù)據(jù),即刻生成媲美真人的多語言語音。

項目:https://github.com/SparkAudio/Spark-TTS

論文:https://www.arxiv.org/abs/2503.01710

Demo:https://sparkaudio.github.io/spark-tts/

3、阿里視頻生成大模型 Wan2.1

Wan-AI 發(fā)布的 140 億參數(shù)的大型模型,用于 First-Last-Frame 到視頻生成。該模型能夠生成 5 秒鐘 720p 高清視頻,并因其創(chuàng)新方法而備受關(guān)注。它于 2025 年 4 月發(fā)布,并附帶推理代碼和權(quán)重。

項目:https://github.com/Wan-Video/Wan2.1

模型文件:https://modelscope.cn/organization/Wan-AI

技術(shù)文件:https://arxiv.org/abs/2503.20314

4、騰訊混元視頻生成

不算新模型了,看到一個最近的項目是基于騰訊混元,才發(fā)現(xiàn)騰訊在這方面也有干貨

FramePack 是一種漸進式生成視頻的下一幀預測神經(jīng)網(wǎng)絡(luò)架構(gòu),通過將輸入上下文壓縮至恒定長度,使生成工作量與視頻時長無關(guān)。該架構(gòu)即便在筆記本電腦 GPU 上,也能用 130 億參數(shù)模型處理超長幀序列。

Project Page:https://lllyasviel.github.io/frame_pack_gitpage/

Paper:https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf

Code:https://github.com/lllyasviel/FramePack?tab=readme-ov-file

混元圖像轉(zhuǎn)視頻模型(基于混元視頻的可定制圖像轉(zhuǎn)視頻模型):https://github.com/Tencent/HunyuanVideo-I2V

混元大型視頻生成模型的系統(tǒng)框架:https://github.com/Tencent/HunyuanVideo

模型文件:https://huggingface.co/tencent/HunyuanVideo

官方介紹+Demo:https://aivideo.hunyuan.tencent.com/

然后還發(fā)現(xiàn)騰訊還有 3D 視頻大模型

官網(wǎng):https://3d.hunyuan.tencent.com/

3D 模型文件:https://huggingface.co/tencent/Hunyuan3D-2

在線試玩:https://huggingface.co/spaces/tencent/Hunyuan3D-2

5、文本到圖像模型

HiDream-I1是一款全新的開源圖像生成基礎(chǔ)模型,擁有 170 億參數(shù),能在數(shù)秒內(nèi)實現(xiàn)頂尖的圖像生成質(zhì)量。HiDream-ai/HiDream-I1-Full: 文本到圖像模型,HiDream 的新模型,生成質(zhì)量非常好

試玩:https://vivago.ai/home

GitHubhttps://github.com/HiDream-ai/HiDream-I1

模型文件:https://huggingface.co/spaces/HiDream-ai/HiDream-E1-Full

6、阿里 Qwen2.5-VL

也不算新,最近有模型更新

阿里開源的旗艦視覺語言模型,在視覺理解方面表現(xiàn)出色,能夠識別常見物體,分析圖像中的文本、圖表等元素。在視頻處理上,Qwen2.5-VL 能夠理解超過 1 小時的長視頻,精準定位相關(guān)片段捕捉事件。模型還支持發(fā)票、表單等數(shù)據(jù)的結(jié)構(gòu)化輸出。

部署教程:

模型文件:https://modelscope.cn/models/Qwen/Qwen2.5-VL-7B-Instruct/files

技術(shù)文件:https://qwenlm.github.io/blog/qwen2.5-vl/

項目地址:https://github.com/QwenLM/Qwen2.5-VL

最后再推薦一個我正在學習的課程:



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
比砒霜還毒!3歲女童大把脫發(fā)、走路如踩棉花,查出急性鉈中毒

比砒霜還毒!3歲女童大把脫發(fā)、走路如踩棉花,查出急性鉈中毒

瀟湘晨報
2025-05-08 19:09:11
A股:不出意外!明天(5月9日)的大盤,會這樣走,上重點

A股:不出意外!明天(5月9日)的大盤,會這樣走,上重點

風風順
2025-05-09 00:09:17
順豐否認購買國產(chǎn)C919貨機

順豐否認購買國產(chǎn)C919貨機

第一財經(jīng)資訊
2025-05-08 16:34:08
央視親自下場發(fā)聲,新劇遭萬人痛批的孫儷,爆火動了誰的蛋糕?

央視親自下場發(fā)聲,新劇遭萬人痛批的孫儷,爆火動了誰的蛋糕?

井普椿的獨白
2025-05-06 21:59:47
夸大對華關(guān)稅效果,她被打假了

夸大對華關(guān)稅效果,她被打假了

觀察者網(wǎng)
2025-05-08 20:27:05
上海解除暴雨預警

上海解除暴雨預警

財聯(lián)社
2025-05-08 22:07:05
留意航班動態(tài),北京兩機場累計降水量預計達到大到暴雨

留意航班動態(tài),北京兩機場累計降水量預計達到大到暴雨

新京報
2025-05-08 19:45:19
NBA大慘案!掘金43分潰敗!亞歷山大轟34+4+8,雷霆宣告王者歸來

NBA大慘案!掘金43分潰敗!亞歷山大轟34+4+8,雷霆宣告王者歸來

鬼魅突破上籃
2025-05-08 12:19:17
2025人口出生率亮紅燈,催三胎無果后,國家開始放大招了

2025人口出生率亮紅燈,催三胎無果后,國家開始放大招了

戶外釣魚哥阿勇
2025-05-06 01:59:11
德國乒乓球隊主帥:雨果奪得世界杯冠軍讓世界看到一切皆有可能

德國乒乓球隊主帥:雨果奪得世界杯冠軍讓世界看到一切皆有可能

懂球帝
2025-05-08 14:32:08
越南人自認為是華夏族后裔,基因檢測結(jié)果出來后,他們沉默了

越南人自認為是華夏族后裔,基因檢測結(jié)果出來后,他們沉默了

詩意世界
2025-05-08 09:49:27
國防部奉勸有關(guān)國家不要引狼入室

國防部奉勸有關(guān)國家不要引狼入室

財聯(lián)社
2025-05-08 15:06:09
恩里克:我們是農(nóng)民聯(lián)賽,但淘汰了4支英超球隊

恩里克:我們是農(nóng)民聯(lián)賽,但淘汰了4支英超球隊

雷速體育
2025-05-08 07:48:41
外媒:美教育部長致信哈佛,被嘲“幾乎不識字”

外媒:美教育部長致信哈佛,被嘲“幾乎不識字”

參考消息
2025-05-08 21:11:11
傷勢嚴重!詹姆斯:即便湖人G5贏了,我也無法參加后續(xù)比賽

傷勢嚴重!詹姆斯:即便湖人G5贏了,我也無法參加后續(xù)比賽

雞丁侃球
2025-05-09 00:44:54
成都ETC整體失效致繞城高速堵死?12122:系成溫邛高速溫江收費站停電,已恢復

成都ETC整體失效致繞城高速堵死?12122:系成溫邛高速溫江收費站停電,已恢復

封面新聞
2025-05-08 13:01:03
巴菲特,投資過兩只中國股票,
一只是比亞迪,
另一只是中國石油

巴菲特,投資過兩只中國股票, 一只是比亞迪, 另一只是中國石油

風風順
2025-05-03 07:05:42
以色列終于決定徹底永久占領(lǐng)加沙,一切有因有果,都是自找的

以色列終于決定徹底永久占領(lǐng)加沙,一切有因有果,都是自找的

山河路口
2025-05-06 23:25:42
拜登卸任后首次受訪:特朗普太掉價了,美國并不代表掠奪

拜登卸任后首次受訪:特朗普太掉價了,美國并不代表掠奪

朗威游戲說
2025-05-09 03:52:41
富豪出國換上非洲器官,三個月后妻子崩潰尋求醫(yī)生幫助

富豪出國換上非洲器官,三個月后妻子崩潰尋求醫(yī)生幫助

曉艾故事匯
2025-04-23 23:39:25
2025-05-09 05:07:00
機器學習與Python社區(qū) incentive-icons
機器學習與Python社區(qū)
機器學習算法與Python
2949文章數(shù) 11008關(guān)注度
往期回顧 全部

科技要聞

理想L煥新版來了,輔助駕駛芯片全系升級

頭條要聞

普雷沃斯特當選新一任天主教羅馬教皇

頭條要聞

普雷沃斯特當選新一任天主教羅馬教皇

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

劉畊宏老婆補刀 清場風波口碑翻車!

財經(jīng)要聞

57政策解讀:力度空前的系統(tǒng)性穩(wěn)增長舉措

汽車要聞

昨天李想點評了AI 今天我讓AI點評了理想

態(tài)度原創(chuàng)

本地
家居
親子
藝術(shù)
教育

本地新聞

非遺里的河南|汴梁鳶舞千年韻!宋室風箏藏多少絕活

家居要聞

侘寂美學 樸素而有生機

親子要聞

孩子舌苔厚口臭家長別著急,中醫(yī)教您一個穴位推拿方法

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

都不想出去玩了,躲在被窩里面做題目,卻感覺越來越難

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 卢氏县| 清丰县| 南岸区| 延安市| 于田县| 民乐县| 星座| 凤冈县| 申扎县| 玉门市| 平顺县| 保定市| 太保市| 同德县| 盈江县| 江北区| 马尔康县| 西吉县| 腾冲县| 黄石市| 福鼎市| 神池县| 定州市| 大埔县| 乌兰察布市| 胶州市| 岢岚县| 浏阳市| 锡林郭勒盟| 攀枝花市| 青冈县| 黄陵县| 喀喇沁旗| 错那县| 繁昌县| 武功县| 乌兰浩特市| 岑溪市| 克东县| 万源市| 江口县|