99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里OmniTalker:上傳視頻,一鍵毛孔級還原聲音表情。羅翔說AI換臉判3年!

0
分享至

作者|子川

來源|AI先鋒官

最近,阿里推出了一項黑科技——OmniTalke,只需給它一段參考視頻,它就能學會視頻里人物的表情以及克隆其聲音,甚至還能模仿說話風格。

就像下面這樣——

比如我們先給OmniTalke一段羅翔老師早期在B站的視頻,讓它學羅老師是怎么說話、什么表情”。

隨后給它一段文字,它就能生成相應的數字人視頻。

提示詞:聽說現在有人拿AI復刻我的聲音和形象,搞的大家分不出來真假,啊,你們這個被抓起來,是要判三年的。

除了說中文外,還能讓羅翔老師實現出海,生成他講英文的視頻。

文本:我試試說幾句英文,啊,I've heard that nowadays, some people are using AI to replicate my voice and appearance, making it hard for everyone to tell the difference between real and fake. Yet, if they get caught, they could be sentenced to three years in prison.

這效果,簡直了!!!

無論是聲音還是表情都模仿得惟妙惟肖,簡直就跟羅翔老師本人,而且無論是英文還是中文,口型和聲音保持高度的統一。

再來一段視頻,比如上傳一段大家非常喜歡的博主@小Lin說的視頻。

輸入文本:想象一下,你面前站著的是一個完全由代碼構建卻仿佛真人般鮮活的2D數字人。它不僅有著細膩入微的表情變化,每一個眼神、每一次微笑都能準確傳達出參考人物的情感特質。

還有雷軍的數字人視頻,上傳雷軍入駐B站時的視頻。

輸入文本:喜歡小米的小朋友們你們好,我是雷軍,今天我當了一個小時的中國首富,感謝大家捧場。

就像視頻中所展示的那樣,OmniTalker除了可以復制表情和聲音外,還能復制該人物說話的風格。

像以往,我們想要生成一個類似的數字人視頻,首先需要準備一張人物的大頭照,并獲取一段該人物的聲音去進行克隆,最后再是輸入提示詞生成相應的數字人視頻。

關鍵是市面上很多數字人產品,生成的數字人視頻機械感賊重,并且聲音和口型高度不統一。

而如今,OmniTalker徹底改變了以往數字人的交互方式,只需提供一段視頻,就能讓它完美復制視頻中人物的表情、聲音。

目前OmniTalker還沒有成熟產品,不過大家可以期待一下。

論文:https://arxiv.org/html/2504.02433

下面是小編簡單總結了一下OmniTalker的核心技術。

OmniTalker 的核心技術

雙分支擴散變換器架構:OmniTalker 采用了獨特的雙分支擴散變換器(DiT)架構。它包含兩個主要分支:音頻分支和視覺分支。

音頻分支負責從文本中合成高質量的語音,而視覺分支則專注于預測頭部姿勢和面部動態。

這兩個分支通過一個新穎的音頻-視覺融合模塊緊密相連,確保音頻和視頻輸出在時間上的同步性和風格上的一致性。

上下文參考學習模塊:OmniTalker 能從一個參考視頻里“偷學”說話人的風格,比如語音的音色、語調,還有面部的表情、動作,然后把它應用到生成的視頻里。

流匹配技術:這是一種高效訓練方法,能讓模型更快地學習和生成內容,就像給汽車裝上了渦輪增壓,讓整個系統跑得更快。

OmniTalker 的優勢

實時交互:它反應超快,能達到每秒25幀的實時推理速度,滿足直播和實時交互的需求。

多模態融合:支持文本、圖像、音頻和視頻等多種輸入方式,無縫整合多模態信息,生成高質量的語音和視頻。

風格保留:它能把參考視頻里的風格學得惟妙惟肖,生成的視頻就像原版的“克隆”。

計算效率:通過流匹配技術和緊湊的模型架構(0.8B參數),在保持高質量輸出的同時實現實時推理。

OmniTalker 的創新點

統一多模態框架:首次將文本到音頻和文本到視頻生成集成在一個模型中,通過跨模態融合實現同步輸出。

簡單來說就是以前生成語音和視頻需要分開做,現在OmniTalker 把它們合在一起,一步到位。

上下文多模態風格復制:不需要額外的訓練數據,只要一個參考視頻,就能實時生成風格一致的說話頭像。

實時效率:通過技術創新實現高質量輸出的同時保持實時推理能力。

可擴展的數據管道和多模態訓練:自動化預處理系統和高效的多階段訓練方法,支持大規模多模態數據的處理和訓練。

掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

往期文章回顧

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
載有53名英國公民的印度客機墜毀,英國首相:場面令人震驚

載有53名英國公民的印度客機墜毀,英國首相:場面令人震驚

環球網資訊
2025-06-12 18:37:44
1968年丁盛拜訪林彪,合影結束后,丁盛說:林總,我有個不情之請

1968年丁盛拜訪林彪,合影結束后,丁盛說:林總,我有個不情之請

歷史龍元閣
2023-07-02 00:23:18
地面至少24人遇難!印度空難細節披露:一個姿勢不尋常…女子因堵車遲到10分鐘,幸運錯過航班

地面至少24人遇難!印度空難細節披露:一個姿勢不尋常…女子因堵車遲到10分鐘,幸運錯過航班

揚子晚報
2025-06-13 20:10:36
開掛了!40歲男子在印度客機墜毀前跳機逃生,僥幸撿回一命

開掛了!40歲男子在印度客機墜毀前跳機逃生,僥幸撿回一命

奪命書生
2025-06-13 03:43:04
天空體育:維爾茨將以1.165億鎊成為英超俱樂部歷史最貴引援

天空體育:維爾茨將以1.165億鎊成為英超俱樂部歷史最貴引援

懂球帝
2025-06-13 19:17:15
充電6分鐘續航1000公里,國產固態電池開始裝車測試

充電6分鐘續航1000公里,國產固態電池開始裝車測試

金融界
2025-06-13 17:30:29
比汪小菲還慘?王思聰傳來噩耗,他最終還是走上父親王健林的老路

比汪小菲還慘?王思聰傳來噩耗,他最終還是走上父親王健林的老路

說歷史的老牢
2025-06-13 15:14:03
當當創始人李國慶宣布離婚財產分割達成和解:前妻俞渝將領導當當網,自己將進軍AI領域

當當創始人李國慶宣布離婚財產分割達成和解:前妻俞渝將領導當當網,自己將進軍AI領域

極目新聞
2025-06-13 13:08:06
無視抗議!亞足聯官方:世預賽第四階段主辦地為沙特、卡塔爾

無視抗議!亞足聯官方:世預賽第四階段主辦地為沙特、卡塔爾

直播吧
2025-06-13 18:04:42
房價大蕭條,北上廣深終于扛不住了。

房價大蕭條,北上廣深終于扛不住了。

流蘇晚晴
2025-06-13 19:31:47
上海男子腹痛沒忍住直接在網約車上排泄!司機:把我空氣都污染了

上海男子腹痛沒忍住直接在網約車上排泄!司機:把我空氣都污染了

小人物看盡人間百態
2025-06-13 05:40:04
財聯社6月12日電,據工信部消息,工信部決定成立部物聯網、腦機接口、民用爆炸物品等3個標準化技術委員會和安全應急裝備標準化工作組。

財聯社6月12日電,據工信部消息,工信部決定成立部物聯網、腦機接口、民用爆炸物品等3個標準化技術委員會和安全應急裝備標準化工作組。

科創板日報
2025-06-12 19:09:10
朱鵬宇爆鏟破門!中超第2球,破76天球荒,馬萊萊斷球助攻一條龍

朱鵬宇爆鏟破門!中超第2球,破76天球荒,馬萊萊斷球助攻一條龍

奧拜爾
2025-06-13 20:58:47
王峰已任武城縣委書記

王峰已任武城縣委書記

魯中晨報
2025-06-13 20:22:15
戰鷹轟鳴,烏軍3條戰線同時反擊,伊朗7員大將遭斬首

戰鷹轟鳴,烏軍3條戰線同時反擊,伊朗7員大將遭斬首

史政先鋒
2025-06-13 15:34:56
上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

懸案解密檔案
2025-05-09 18:00:29
是誰遮蔽了墜亡醫生的舉報之光?官方終于回應,離真相或越來越近

是誰遮蔽了墜亡醫生的舉報之光?官方終于回應,離真相或越來越近

楊哥歷史
2025-06-13 11:40:51
小米發了個199的新品,把所有網友都整不會了

小米發了個199的新品,把所有網友都整不會了

鋒潮評測
2025-06-13 16:24:07
冠心病最早信號不是心臟疼!醫生:頻繁出現6異常,心臟或已病變

冠心病最早信號不是心臟疼!醫生:頻繁出現6異常,心臟或已病變

新時代的兩性情感
2025-06-13 14:12:15
曝杜蘭特下家縮減至兩隊!火箭森林狼誰能勝出?答案最快下周揭曉

曝杜蘭特下家縮減至兩隊!火箭森林狼誰能勝出?答案最快下周揭曉

羅說NBA
2025-06-13 20:01:26
2025-06-13 23:08:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
295文章數 18關注度
往期回顧 全部

科技要聞

報志愿非得花上萬元找"張雪峰"?AI行不行

頭條要聞

以軍發動襲擊前 內塔尼亞胡到哭墻塞了一張紙條

頭條要聞

以軍發動襲擊前 內塔尼亞胡到哭墻塞了一張紙條

體育要聞

世界第一和他背后的智囊

娛樂要聞

宋茜壓軸風波升級!官方下場暗示順序

財經要聞

5月M2同增7.9% 前5個月存款增14.73萬億

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

時尚
健康
數碼
親子
房產

“老頭背心”太火了,今年流行的風格都離不開它

呼吸科專家破解呼吸道九大謠言!

數碼要聞

4000的紅米小平板買嗎?

親子要聞

#戳戳畫 #益智玩具

房產要聞

18位頂級買家瘋搶!凱旋新世界,憑何成為廣州頂豪終極價值錨點?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 淮北市| 吉水县| 天峨县| 阿拉善右旗| 永登县| 杂多县| 兴仁县| 集安市| 通化市| 汤阴县| 色达县| 安宁市| 留坝县| 洛扎县| 拉萨市| 巴楚县| 洛南县| 昌吉市| 阿图什市| 漾濞| 维西| 成都市| 富顺县| 宁化县| 文安县| 社会| 施秉县| 蒙阴县| 葫芦岛市| 武强县| 鹤山市| 利津县| 务川| 建水县| 隆回县| 五大连池市| 西青区| 平昌县| 石狮市| 旬邑县| 阿拉善右旗|