99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

“AI語音之王”科大訊飛聲音復刻技術大升級,成品人機難辨!

0
分享至



智東西

作者 | 程茜

編輯 | 漠影

讓《長安的荔枝》男主角李善德親自推薦自己的電視劇是什么體驗?



這段讓人難辨真假的音頻并非真正出自李善德之口,其應用的正是科大訊飛近期升級的聲音復刻技術,李善德痛斥右相的段落中,聲調拔高,語速加快,聲音復刻技術呈現的李善德推薦《長安的荔枝》音頻中,不僅將聲線高度契合,而且把語音中包含的情緒也復刻得非常到位。值得注意的是,這段AI“李善德”的學習素材僅需不到10s。

去年,訊飛星火App的小星暢聊里就上線了一句話聲音復刻功能,如今,訊飛星火新版聲音復刻功能也已更新,人人都可擁有同聲線的數字分身。同時,新一代的聲音復刻能力也已正式上線訊飛開放平臺,開發者可通過API進行接入和調用。

在App中創建聲音,用戶只需要選擇性別,朗讀一句話,就可以快速生成自定義聲音,并與之進行對話。



作為AI語音王者,科大訊飛在語音技術領域的深耕,以及在智能駕駛、教育等人機交互場景的廣泛應用,已經使其成為全球語音領域的頭部企業,其語音相關項目不僅兩次獲得國內知識產權領域的最高獎項中國專利金獎,同時還斬獲國家科學技術進步獎一等獎。

在這一背景下,科大訊飛聲音復刻技術的背后到底有哪些黑科技?語音技術將帶給科技行業什么樣的想象空間?智東西將從訊飛星火App的相關功能體驗出發,找到這些問題的答案。

一、秒級自定義AI發音人,蠟筆小新、哪吒跨時空交流

如今更貼近人類日常交流的語音交互模式,幾乎已經成為聊天機器人的必備功能。

訊飛星火App的語音通話功能中,不僅支持其內置的14位發音人與用戶流暢對話,還可以通過一句話創建屬于自己的發音人。

可以看到,App中已經預設了14個發音人,包含普通話、英文、方言、日語、俄語等多種語音包。



想要自己創建發音人的過程也極為簡單,用戶只需選擇性別,然后根據提示朗讀屏幕上的一句話,等待幾秒鐘就能創建成功,同時為了讓其更符合用戶的使用習慣,還能添加相應人設。

下面有幾個案例來感受一下一句話聲音復刻技術的驚艷效果,用這項技術對用戶熟知的影視劇角色、動漫人物聲音進行了復刻,通過對比,我們可以更為直觀地感受到其聲音合成的相似度與準確度。

科大訊飛的聲音復刻技術還讓兩大經典影視劇中的甄嬛和佟掌柜來了一場世紀交流,當AI用《甄嬛傳》中甄嬛的復刻聲線說出《武林外傳》佟掌柜的經典臺詞時,僅需不到6s的音頻即可瞬間讓《武林外傳》資深觀眾來了一波穿越。

其合成音頻中,不僅復刻了甄嬛的聲線,語氣也十分平緩,訴說過程銜接自然流暢。

第三是動漫形象,基于科大訊飛的聲音復刻技術,哪吒和蠟筆小新實現了跨時空交流。

通過不到7s的音頻素材進行學習,就可以復刻蠟筆小新的聲音,并讓其準確說出哪吒的經典打油詩。

同時,哪吒也可以開口說蠟筆小新的經典臺詞,與其寵物小白隔空交流,復刻的音頻中,既保留了哪吒的獨特聲線,還有其特殊的尾音上揚特征。

這些音頻的實現效果,有的僅需要原角色不到5s的音頻就能實現,且可以看出上面幾段音頻都沒有出現明顯的卡頓,還復刻了聲調上揚、語速、說話節奏等細微的特征。

二、從音色到停頓、發音流暢自然,打造三階段層次化語音建模框架

對于這些深入人心的影視角色,用戶在一些更為細節的發音特征上或許感知并不是很強烈,但在訊飛星火App自定義創建聲音的場景中,用戶對發音人復刻效果的要求更高,這對聲音復刻功能提出了更大挑戰。

因此想要實現“一句話聲音復刻”的背后,需要面臨三大關鍵難題:如何從一句話中精準提煉用戶發音的多種特性、如何保證聲音相似、如何準確還原用戶的停頓、發聲、重音習慣以及口癖等。

在此基礎上,科大訊飛為個性化的語音合成打造了“三階段層次化語音建模框架”,試圖將用戶輸入一句話音頻的各種聲音信息都捕捉到位。

具體來看,該框架具體分為三個階段,通過星火底座大模型精確捕捉發音規律和韻律特征、在音色恢復階段解耦并重構聲學特征、通過聲碼器恢復高保真波形。

傳統聲音復刻技術往往需要數小時甚至數十小時語音樣本進行訓練,而基于星火語音大模型底座能力,其可以快速從短時間音頻中提取語音中的基礎元素。

其第二個階段的本質正是通過將語音的音色屬性從復雜的混合信號中剝離出來,并按照目標需求重新組合關鍵特征,以提高音色還原的準確性。

第三個階段中的高保真波形恢復,能夠盡可能還原原始音頻的時域細節、頻譜特征和動態范圍。

據了解,這套語音建模框架突破語義表征,采用mel VQ-AE模型(Mel頻譜向量量化自編碼器)結合語音自監督預訓練編碼器,并引入音色最小互信息約束,能解耦出音色無關的離散語義token,實現了發音內容與音色特征的可控分離,并可以提升語義大模型的建模穩定性。

同時,讓合成聲音更為自然還有一大關鍵是,發音需流暢且音色一致,因此在音色解耦表征的基礎上,科大訊飛進一步通過音色增強以及強化學習,來實現聲音復刻的人機難辨。

其中,音色增強是指在聲學模型中,研究人員融合全局聲紋嵌入與局部幀級音色編碼,提取細粒度音色特征,并構建聲紋空間語義一致性損失函數,提升音色恢復的相似度;主要是通過語音魯棒性評價模型和人工標注構建偏好數據集,采用基于DPO的強化學習策略提升合成語音的穩定性和自然流暢度。

在這些綜合作用下,科大訊飛的語音合成技術已經可以做到,只需一句話錄音就能完整捕捉用戶喉腔共鳴、口音特點、氣息流轉等發音特征,并精準還原用戶的停頓習慣、情感起伏和呼吸節奏。

基于此才能達到真人難以區分的復刻效果,為車載語音交互系統、個性化智能客服、智能體交互的應用場景打開更大想象空間。

三、多次拿下業界國家級大獎,橫縱布局加速語音技術落地

一直以來,語音都是人類最自然的交流方式,因此業界一直圍繞著模擬人類對話過程、使機器能夠理解并回應人類語音指令進行探索。

作為國內AI領域國家隊,科大訊飛早在2011年就肩負起語音及語言處理國家工程實驗室(后升級為工程研究中心)的重任,并成為全球語音技術領域的頭部玩家。

時至今日,科大訊飛在語音領域已經碩果累累,最直觀的數據就是,本月,科大訊飛憑借“基于時延估計的回聲消除方法及裝置”專利入選第二十五屆中國專利金獎項目名單,這也是其第二次獲得這一國內知識產權領域的最高獎項,同時也是安徽省唯一一家兩次獲得中國專利金獎的單位。

此外,去年其“多語種智能語音關鍵技術及產業化”項目還斬獲國家科學技術進步獎一等獎。



在技術深耕之下,科大訊飛不僅實現了在語音識別、語音合成領域的準確度、識別語種、相似度等各項性能的縱向提升,還橫向拓寬了語音技術的應用場景,從識別、翻譯到合成,以及智能駕駛、智能客服、教育等諸多場景。

去年9月,科大訊飛在語音識別領域的賽事CHiME-8奪冠,并實現五連冠。語音識別首次實現全國地級市方言全覆蓋,包括288個地市202種方言。

此前科大訊飛正式發布的星火語音大模型,實現74個語種、方言免切換對話;且根據真實業務構建的語音輸入場景測試集,星火語音大模型37個語種語音識別效果領先OpenAI發布的開源語音識別模型Whisper-V3.5。

同時其能在強干擾場景下實現精準語音識別,在兩人疊混場景、三人疊混場景中和-5dB高噪音場景中的語音轉寫效果遠超Whisper和Gemini。

在此基礎上,星火語音大模型已經深度運用在各種人機交互場景中,如智能座艙、教育等諸多領域。

可見語音技術的攻關非一日之功,在技術深耕與場景應用上的雙重發力,使得科大訊飛的語音技術正在全球扮演著愈發重要的角色。

結語:更自然流暢的語音交互,正擴寬AI應用場景

語音交互使人們可以通過說話來操作設備和獲取信息,無需手動輸入或操作復雜的界面。如今隨著技術的發展,語音識別和合成技術為聊天機器人等AI工具賦予了自然交互能力,使其與用戶的交流更加流暢。

與此同時,企業也在不斷探索新的算法和模型,在突破語音識別、合成準確率的同時,拓寬其應用場景,使得語音與自然語言處理、計算機視覺等技術相互融合,以推動AI的發展,而科大訊飛在技術融合與場景落地方面的積累,已展現出顯著的競爭力。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
近期高發!上海已有多人中招!民警此舉動太意外

近期高發!上海已有多人中招!民警此舉動太意外

看看新聞Knews
2025-06-26 22:07:07
美國轟炸伊朗核設施背后:B-2為何能連飛44小時不燒發動機?

美國轟炸伊朗核設施背后:B-2為何能連飛44小時不燒發動機?

徐德文科學頻道
2025-06-23 12:47:48
特朗普一炸,中伊3萬億投資血本無歸?中國早已預料到了這一天

特朗普一炸,中伊3萬億投資血本無歸?中國早已預料到了這一天

科技虎虎
2025-06-24 10:17:30
全滿貫球員都是誰?足壇僅有6人,齊達內上榜,梅西榮譽無人能及

全滿貫球員都是誰?足壇僅有6人,齊達內上榜,梅西榮譽無人能及

籃球圈里的那些事
2025-06-26 15:23:50
河南逆轉勝利,何超烏龍不可怕,拉莫斯賽后發言引關注

河南逆轉勝利,何超烏龍不可怕,拉莫斯賽后發言引關注

兩兄弟養牛
2025-06-27 00:03:11
高圓圓帶女兒巴塞羅那度假!一眼就看到了她,走到哪里都閃閃發光

高圓圓帶女兒巴塞羅那度假!一眼就看到了她,走到哪里都閃閃發光

小娛樂悠悠
2025-06-26 08:52:43
突然崩了!官方致歉!

突然崩了!官方致歉!

掌上春城
2025-06-25 16:27:27
鄭欽文逆轉勝,奧運亞軍遭翻盤晉級8強

鄭欽文逆轉勝,奧運亞軍遭翻盤晉級8強

老牛體育解說
2025-06-26 05:44:50
中國寄生蟲最多的5種食物,很多人還特愛吃,建議大家盡量少吃

中國寄生蟲最多的5種食物,很多人還特愛吃,建議大家盡量少吃

農夫也瘋狂
2025-06-18 11:11:47
阿斯:馬競放棄羅伯遜和迪涅,將以2000萬歐簽下亞特蘭大的魯杰里

阿斯:馬競放棄羅伯遜和迪涅,將以2000萬歐簽下亞特蘭大的魯杰里

直播吧
2025-06-27 00:11:07
93年我晉升副師長,妻子帶女兒探營,司令員見到她后呆住了

93年我晉升副師長,妻子帶女兒探營,司令員見到她后呆住了

今天說故事
2025-06-24 19:49:37
丟臉到國外!被央視多次點名的“文盲”,被郝蕾徹底扯下遮羞布

丟臉到國外!被央視多次點名的“文盲”,被郝蕾徹底扯下遮羞布

白面書誏
2025-05-12 19:09:53
醫生發現:經常吃面放醋的人,用不了多久,血管或有這3個變化!

醫生發現:經常吃面放醋的人,用不了多久,血管或有這3個變化!

白宸侃片
2025-05-31 12:03:57
“600分只能上二本”,浙江2025年高考特招線592分,考生欲哭無淚

“600分只能上二本”,浙江2025年高考特招線592分,考生欲哭無淚

妍妍教育日記
2025-06-26 17:32:34
李在明上臺22天后,對“中美二選一”表態,韓國要走第三條路

李在明上臺22天后,對“中美二選一”表態,韓國要走第三條路

娛樂的宅急便
2025-06-27 00:20:43
又一間諜被抓!央視曝光,泄露我國大量內部資料,原因令人意外

又一間諜被抓!央視曝光,泄露我國大量內部資料,原因令人意外

不寫散文詩
2025-06-26 15:22:57
丟人丟到國外了?萬千惠袒胸露乳走紅毯,被多次驅趕還賴著不走

丟人丟到國外了?萬千惠袒胸露乳走紅毯,被多次驅趕還賴著不走

聚合大娛
2025-05-28 16:12:33
51歲的中國廚師在北海道一家超市順走258日元的貓糧一包,被警方逮捕了喵~~

51歲的中國廚師在北海道一家超市順走258日元的貓糧一包,被警方逮捕了喵~~

日本物語
2025-06-25 21:33:11
越南取消8項死刑罪名,越南女首富張美蘭將由死刑改判終身監禁 ,律師:她非常高興

越南取消8項死刑罪名,越南女首富張美蘭將由死刑改判終身監禁 ,律師:她非常高興

每日經濟新聞
2025-06-25 21:53:12
中紀委劃紅線!機關事業單位職工下班后,不能去這8類場所!

中紀委劃紅線!機關事業單位職工下班后,不能去這8類場所!

金哥說新能源車
2025-06-11 13:29:08
2025-06-27 04:20:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10079文章數 116783關注度
往期回顧 全部

科技要聞

小米YU7價格來了!標準版起售價25.35萬元

頭條要聞

小米YU7開啟預定3分鐘大定破20萬臺 只比SU7貴3萬

頭條要聞

小米YU7開啟預定3分鐘大定破20萬臺 只比SU7貴3萬

體育要聞

蓄謀已久的開拓者,就是最適合楊瀚森的球隊

娛樂要聞

倪妮,怎么突然下桌了?

財經要聞

央視再揭茅臺鎮“年份酒”造假黑幕

汽車要聞

智界全系2萬元現金減免 豪華智能限時普惠

態度原創

房產
時尚
本地
旅游
藝術

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

感覺生活停滯不前的時候,試試這5個小方法獲得能量

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 云龙县| 沭阳县| 锡林郭勒盟| 重庆市| 泰宁县| 峨眉山市| 方正县| 正宁县| 东辽县| 即墨市| 怀化市| 绵竹市| 盐津县| 健康| 襄垣县| 图木舒克市| 孟村| 娱乐| 育儿| 达州市| 威宁| 永登县| 中山市| 正镶白旗| 江源县| 洮南市| 阿合奇县| 秦皇岛市| 道孚县| 甘洛县| 扶绥县| 陕西省| 湛江市| 本溪市| 米泉市| 织金县| 无锡市| 聂拉木县| 集安市| 垫江县| 新乐市|