99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

視頻大模型登頂榜首,居然是這家中國AI公司

0
分享至

用AI生成視頻,很多人可能還停留在Sora當年文生視頻帶來的震撼。

但到了今天,能夠生成視頻的已經不只是一行文字。2025年,生成式AI的多模態能力正以難以想象的速度進化,挑戰很多人認知的是,現在AI已經進化到給出一張圖片,大模型就能夠根據圖片來生成一則完整的視頻。

而更加令人意外的是,這條最前沿圖生視頻賽道榜首居然是由一個來自中國公司的團隊開發的。

5月17日,全球最為權威的視頻生成評測榜單 VBench Leaderboard 更新了最新一期圖生視頻榜單。一款名為Steamer-I2V的視頻生成模型以總分89.38%的成績,登上 VBench-I2V圖生視頻榜首。



Steamer-I2V 是一種基礎圖像到視頻 (I2V) 生成模型,旨在將靜態圖像轉換為時間上連貫且具有視覺吸引力的視頻序列,并具有增強的可控性和保真度。

換句話說,Steamer-I2V 現在是圖生視頻最好的大模型產品。

最開始甚至有人懷疑,這是游戲平臺Steam跨界AI了?但很快發現不是。按照 VBench Leaderboard官網公布的介紹:

Steamer團隊,來自百度公司。



當前全球科技巨頭都在競逐多模態生成賽道,這場AI競賽的烈度還在不斷上升之中。

誰能想到,就像當年DeepSeek-V2最初發布時無人關注一樣。在悄無聲息間,圖生視頻大模型的榜一王座,已經被百度公司拿下了。

01

未來賽道

2025年AI行業公認的熱門賽道,除了AI Agent,恐怕就是視頻生成模型了。

后者作為多模態中技術難度最高、需求最為復雜的領域,一直被認為是本輪生成式AI競速的最前沿。

而圖生視頻之所以被視為多模態人工智能領域中最具前景的賽道之一,其核心在于它既是技術創新的前沿陣地,也是連接虛擬與現實世界的樞紐。

隨著生成式AI從文本、圖像向視頻跨越,這一技術不僅突破了靜態表達的局限,更通過動態內容生成重構了人類對數字世界的交互方式。

國內也已經有人迫不及待測試了Steamer-I2V的表現,其呈現效果已經堪比電影級制作。

「開大船的ai劇組」近日上傳了由Steamer-I2V制作生成的半分鐘視頻。這則視頻由一張致敬《流浪地球》的圖片生成。





如果要用語言文本來表達這則圖片,文本語義復雜不說,可能結果也會見仁見智。但如果是文本+圖片聯合對模型提出prompt,效果則大不相同。圖片本身所蘊含的豐富信息,使得AI能夠更加精準地捕捉用戶需求。

·從視頻本身可以看出,Steamer-I2V已經能夠以導演拍攝的角度,在原有圖片的基礎上進行理解,并且能夠對視頻基本劇情、畫面形成一個判斷,在保障模型對畫面細節、主體運動軌跡、風格屬性和鏡頭語言的遵循的基礎上,輸出一個相對結構完整的視頻。

·從畫面清晰度來看,基于前沿的生成式方法與Transformer擴散架構,模型可生成分辨率高達1080P的高清視頻,呈現流暢的過渡效果與逼真的物理運動規律。

·而這背后的底層其實不僅僅是分辨率,而是「技術美學」的偏好。

按照其技術參數報告,Steamer-I2V 基于條件控制的微調(Conditional Fine-Tuning, CFT)策略,可以幫助引導模型對于圖片美學元素進行分析和拆解并進而再生成同一元素的視頻,以保證實現用戶意圖的一致性,而非僅僅停留在簡單的、表面的模仿。

·而且相比最早OpenAI的Sora,Steamer-I2V的優勢在于更懂中國用戶。眾所周知中文博大精深,要理解語義的多樣性,必須基于龐大的語言訓練數據基礎。

據了解,Steamer-I2V 背后基于的是億級規模的中文多模態訓練數據庫,它通過「篩選-凈化-配比」這樣的三級數據優化體系,這意味著其具備了專業級中文概念解析能力。



回過頭再來看產業側的趨勢,文生視頻目前已經處于爆發階段。

根據 GIR (Global Info Research)調研,2023 年全球文生視頻大模型收入大約為720 萬美元,預計 2030 年達到 22.19 億美元,2024 至 2030 期間,年復合增長率 CAGR 有望達到 56.6%。

而作為更為前沿的領域,圖生視頻技術雖然目前缺乏直接的市場規模數據,但其應用場景廣泛,廣告、影視、游戲等領域對高質量圖像和視頻的需求正在持續增長。

企業可以通過圖生視頻工具快速生成個性化的廣告視頻,影視制作中可以利用圖生視頻技術快速生成故事板、分鏡頭腳本等,這顯然比簡單的單一文字模態更加具有吸引力。

也就是說,AI應用的新賽道競速,中國企業也已經領先半子。

02

百度進擊

百度AI今年可謂是動作頻頻。

年初推出的「百看」智能搜索,就正在意圖超越傳統模式,通過大模型整合全網信息生成結構化答案,將搜索從「鏈接陳列」升級為「決策助手」。

這項變革讓搜索結果告別碎片化,AI能結合用戶興趣與未明說的需求,日均數十億次搜索沉淀的數據洞察成為精準服務的基石。

其中多模態輸入突破文字框限制,語音、圖像皆可觸發自然對話式交互,而「任務助力」功能整合服務與工具,使搜索從信息入口進化為連接AI服務的超級站點。

其實從這個時期就可以看出,多模態正在成為百度AI的核心產品戰略之一。

而現在,Steamer-I2V在VBench榜單的意外悄然登頂,這不僅意味著在多模態進化和提振內容生產力方向上,百度再落下關鍵一子,而且再一次證明一件事,外界可能還是大大低估了百度的技術實力。

而技術實力和應用創新密不可分。

圖生視頻技術能與現有AI產品矩陣形成深度協同。未來用戶輸入一張商品圖片,AI不僅能生成營銷文案和PPT,還能自動創建展示視頻,實現「圖文影音一體化交付」,大幅提升企業內容生產效率。

這種多模態能力的融合,將鞏固百度在AI辦公賽道的核心競爭力,尤其在電商、廣告等視頻依賴型行業中形成差異化優勢。

而當圖生視頻與搜索、文庫、網盤等超級應用的數據流、工作流深度耦合時,百度構建的將不僅是單一技術優勢,而是一個自進化、高壁壘的AI生態體系。

這場生成式AI競賽,真是越來越值得期待了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
炒空心菜,直接下鍋炒是大錯,教你飯店不外傳技巧,翠綠也不發黑

炒空心菜,直接下鍋炒是大錯,教你飯店不外傳技巧,翠綠也不發黑

秀廚娘
2025-06-15 18:10:16
資本力量太可怕!半個娛樂圈都在吹捧的labubu,被郭麒麟戳破真相

資本力量太可怕!半個娛樂圈都在吹捧的labubu,被郭麒麟戳破真相

趣文說娛
2025-06-12 13:46:39
放任工作人員對詹姆斯冷嘲熱諷,還想老詹退役后為他們打工

放任工作人員對詹姆斯冷嘲熱諷,還想老詹退役后為他們打工

阿雄侃籃球
2025-06-15 23:31:52
殷桃問雷佳音:怎么不推薦我出演《長安的荔枝》?岳云鵬反應搞笑

殷桃問雷佳音:怎么不推薦我出演《長安的荔枝》?岳云鵬反應搞笑

行者聊官
2025-06-15 17:17:14
伊朗反對軍準備發起進攻!德黑蘭核設施遭受重擊

伊朗反對軍準備發起進攻!德黑蘭核設施遭受重擊

項鵬飛
2025-06-15 20:21:18
李夢因傷無緣亞洲杯大名單,本人發長文致謝:感謝祖國和國家隊,這不是終點

李夢因傷無緣亞洲杯大名單,本人發長文致謝:感謝祖國和國家隊,這不是終點

魯中晨報
2025-06-16 09:06:12
吳彥祖曬多張混血女兒合影!12歲吳斐然眉眼英氣,像爸爸也像媽媽

吳彥祖曬多張混血女兒合影!12歲吳斐然眉眼英氣,像爸爸也像媽媽

TVB的四小花
2025-06-16 11:51:10
馬筱梅降服小菻菻有一套,小菻菻對她的話深信不疑,汪小菲服了!

馬筱梅降服小菻菻有一套,小菻菻對她的話深信不疑,汪小菲服了!

鄭丁嘉話
2025-06-16 10:36:03
四川男子過度放縱18歲女兒,偷送成人禮物被母親撞見 ,釀成慘劇

四川男子過度放縱18歲女兒,偷送成人禮物被母親撞見 ,釀成慘劇

阿妹講故事
2025-03-16 21:06:48
高考后旗袍迎來“退貨潮”,汗臭難聞吊牌沒摘,網友:犯了大忌!

高考后旗袍迎來“退貨潮”,汗臭難聞吊牌沒摘,網友:犯了大忌!

涵豆說娛
2025-06-14 09:06:48
TVB最強Body花旦恨放假罕曬泳裝照,身材Fit爆與17年前選港姐一樣

TVB最強Body花旦恨放假罕曬泳裝照,身材Fit爆與17年前選港姐一樣

粵睇先生
2025-06-16 12:41:57
賴昌星不再隱瞞,被捕后揭露與董文華的關系,難怪老藝術家會退圈

賴昌星不再隱瞞,被捕后揭露與董文華的關系,難怪老藝術家會退圈

小蓋紀實
2024-10-23 14:04:41
我幫鄰居女兒補數學,高考后她舉報我收費,成績公布那天她哭著上門

我幫鄰居女兒補數學,高考后她舉報我收費,成績公布那天她哭著上門

黃家湖的憂傷
2025-06-11 16:58:32
快訊!以媒:以色列軍機襲擊伊朗“圣城旅”位于德黑蘭的指揮中心

快訊!以媒:以色列軍機襲擊伊朗“圣城旅”位于德黑蘭的指揮中心

環球網資訊
2025-06-16 12:41:50
夜場女孩為什么拒絕接吻?網友:這是行業內最后的一絲尊嚴!

夜場女孩為什么拒絕接吻?網友:這是行業內最后的一絲尊嚴!

特約前排觀眾
2025-06-10 00:05:09
李在明膽大敢為,徹底斬亂韓國動亂根源,歷屆總統不敢動,他不怕

李在明膽大敢為,徹底斬亂韓國動亂根源,歷屆總統不敢動,他不怕

獵火照狼山
2025-06-15 22:00:59
S家局面徹底失控!兩大恩人全“反水”,小S成了過街老鼠無人理

S家局面徹底失控!兩大恩人全“反水”,小S成了過街老鼠無人理

火之文
2025-06-15 15:10:06
白巖松又出金句:60到80是最好的年齡!驚醒千萬中老年人!

白巖松又出金句:60到80是最好的年齡!驚醒千萬中老年人!

詩詞中國
2025-05-14 12:49:28
以色列和伊朗攤牌:中東面臨滑向更大沖突風險

以色列和伊朗攤牌:中東面臨滑向更大沖突風險

上觀新聞
2025-06-15 08:20:08
河南養老金調整將開始,歷年傾斜變化,工齡35年能漲100元嗎?

河南養老金調整將開始,歷年傾斜變化,工齡35年能漲100元嗎?

小嵩
2025-06-16 09:06:23
2025-06-16 13:35:00
深水研究 incentive-icons
深水研究
專注數字化與全球化。
49文章數 5關注度
往期回顧 全部

科技要聞

22年后,馬斯克“殺死”了最初的特斯拉

頭條要聞

媒體:在伊朗與以色列的沖突中 伊拉克的態度耐人尋味

頭條要聞

媒體:在伊朗與以色列的沖突中 伊拉克的態度耐人尋味

體育要聞

被偷走的世界杯資格 他們用20年搶回來了

娛樂要聞

郭富城官宣方媛懷三胎 拒絕透露性別

財經要聞

大廠搶灘的「穩定幣」,能火多久?

汽車要聞

前臉與N7相似 新一代日產軒逸假想圖曝光

態度原創

數碼
房產
健康
手機
教育

數碼要聞

HKC 惠科推出全球首款 800Hz 刷新率電競顯示器,24.5 英寸 FHD

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

呼吸科專家破解呼吸道九大謠言!

手機要聞

iPhone 17 Pro發布三個月倒計時!12項配置升級:首次堆散熱、12GB內存

教育要聞

2024智慧家長家教好故事展播(三十六)

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 苍梧县| 理塘县| 凤阳县| 五原县| 疏附县| 新河县| 富宁县| 大连市| 菏泽市| 屏边| 汶上县| 赣州市| 浪卡子县| 古田县| 从化市| 鲁甸县| 于都县| 蓬莱市| 浪卡子县| 三原县| 天祝| 建平县| 济宁市| 若尔盖县| 秦皇岛市| 富锦市| 宝清县| 洪泽县| 邳州市| 武安市| 井陉县| 大厂| 尉犁县| 金川县| 富民县| 平南县| 怀宁县| 乌拉特前旗| 上犹县| 棋牌| 乌兰县|