99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,字節掏出AI同傳模型王炸,2秒延遲,0樣本復刻你的聲音,一手實測來了

0
分享至


智東西
作者 江宇
編輯 漠影

智東西7月24日報道,今日,字節跳動Seed團隊正式推出端到端同聲傳譯模型Seed LiveInterpret 2.0

這是首個翻譯準確率、語音延遲與聲音復刻三方面同時逼近專業同傳表現的產品級中英語音同傳系統。


在中英互譯任務中,Seed LiveInterpret 2.0已達到業界最優水平(SOTA),其譯文質量、響應速度與音色還原能力,在多項主客觀評測中均表現突出。

該系統采用全雙工語音理解與生成框架,支持“邊聽邊說”的實時傳譯語音延遲最低可至2到3秒。同時,它具備0樣本聲音復刻能力,無需預錄音,即可用說話者的音色“說出”外語。

當前,Seed LiveInterpret 2.0已通過火山引擎開放試用,用戶可登錄控制臺體驗語音模型“Doubao-同聲傳譯2.0”。

此外,Ola Friend耳機也計劃于8月底接入該系統,成為首個支持其語音同傳能力的硬件設備。

技術報告與體驗指路:

技術報告:
http://arxiv.org/pdf/2507.17527

項目主頁:
https://seed.bytedance.com/seed_liveinterpret

體驗鏈接:登錄火山引擎后,選擇語音模型“Doubao-同聲傳譯2.0”
https://console.volcengine.com/ark/region:ark+cn-beijing/experience/voice?type=SI

一、全雙工語音生成框架,實現真正“邊聽邊說”

字節Seed團隊曾在2024年推出初代模型CLASI,解決了文本同傳的時延與專業性問題,但仍不支持語音輸出

時隔一年,團隊在模型結構、語音生成與訓練策略上持續優化,最終推出Seed LiveInterpret 2.0,首次實現“邊聽邊說”的語音到語音同傳。

Seed LiveInterpret 2.0引入了雙通路(duplex)語音理解與生成架構,這一端到端方案減少了中間環節,在處理效率和翻譯準確率上表現更優。系統能邊接收源語言語音輸入,邊生成目標語言語音輸出,且可實時處理多人說話場景


▲Seed LiveInterpret 2.0的雙通路(duplex)語音理解與生成架構(圖源:字節跳動Seed)

尤其值得注意的是,相比傳統同傳系統需等待語音識別完成再生成譯文,Seed LiveInterpret 2.0可在聽音過程中同步生成目標語音,實現平均約2.5秒內完成首個譯句輸出(FLAL),顯著接近人類同傳表現。


▲圖為語音到語音同傳任務中,Seed LiveInterpret 2.0與主流系統在翻譯質量與延遲表現上的對比。(圖源:技術報告)

實測結果顯示,其語音翻譯延遲可低至2到3秒,相比傳統機器同傳系統平均減少了超過60%的等待時間,實現真正的“邊聽邊說”。

二、強化學習上場,翻譯更智能、延遲再壓縮

盡管早期版本Seed LiveInterpret 1.0在文本同傳已有不俗表現,但如何兼顧音頻輸出的節奏感與準確度,始終是AI同傳系統的關鍵難題。

為此,字節Seed團隊引入強化學習機制,在延遲、譯文準確率和節奏控制上進行聯合建模優化。

據技術報告描述,團隊設計了融合單步反饋與全局反饋的雙重獎勵機制,分別用于保障片段級語義一致性和整體譯文的邏輯連貫性。

在訓練方法上,團隊采用了兩階段流程:先通過單步獎勵預熱模型,學習人類譯員的翻譯策略,再利用全局獎勵機制優化模型對整體語義與響應延遲的控制。

這一機制顯著降低了模型生成輸出的滯后時間。如在長文本中譯英任務中,經過RL優化后的Seed LiveInterpret 2.0將音輸出延遲從3.90秒降至2.37秒翻譯質量得分也從75.1提升至79.5


▲圖為RealSI長文本同傳基準下的系統性能對比(圖源:技術報告)

模型還具備自適應節奏控制能力,能夠根據語音輸入的清晰度與表達節奏,智能調整輸出時機與語速。

在長時間演講等場景中,系統會主動保持譯文與源語的節奏一致,避免“跟不上講話節奏”或“提前結束”等不同步問題。

三、0樣本聲音復刻,譯音既準又像“你”

Seed LiveInterpret 2.0引入“0樣本聲音復刻”能力,只需實時采樣對話語音,系統便能學習并克隆用戶的音色特征,以“原聲”輸出目標語種譯文。這一能力在真實會議、演講、跨語種溝通中極具實用價值,不僅降低理解門檻,也增強語義情緒的傳達。

在多輪語音評測中,Seed LiveInterpret 2.0是唯一支持“中英雙向語音到語音同傳+聲音克隆”的系統,其SVIP(語音譯文有效信息比例)在zh-en方向達到67.8在en-zh方向達到64.7,音質、節奏、語調高度擬人。


▲圖為語音到語音同傳任務中,Seed LiveInterpret 2.0與主流系統在SVIP(語音譯文有效信息比例)上的對比。(圖源:技術報告)

得益于Seed LiveInterpret 2.0的聲音復刻能力,用戶在與不同語言背景的人交流時,依然能用自己的音色輸出外語譯文,在提升識別度的同時,也增強了交流的親和力。

智東西第一時間進行了試用,在“同聲傳譯”的過程中,系統對英文語音的翻譯響應較快,音色復刻也具備一定相似度,能聽出說話者的語氣。

但整體仍存在一定延時感,特別在語速變化或語句較長時更為明顯。

四、專業評測驗證:翻譯準確率達74.8分

為評估系統性能,字節Seed團隊基于中英雙向RealSI標準數據集,邀請專業同傳譯員團隊進行人工打分。

結果顯示,在語音到語音翻譯任務中,其譯音質量得分達66.3,顯著超過同類系統。在語音到文本的中英互譯任務中,Seed LiveInterpret 2.0的平均翻譯質量得分為74.8(滿分100),相比第二名系統高出58%


▲圖示為語音到文本(S2T)和語音到語音(S2S)同傳任務中,人工評測的翻譯質量與響應效率結果。其中部分商業翻譯系統以字母代稱。(圖源:字節跳動Seed)

同時,在延遲方面,語音到文本場景中平均輸出首字延遲僅為2.21秒,語音到語音場景延遲為2.53秒,展現了質量與速度的良好平衡。

系統在BLEURT、COMET等客觀翻譯指標上同樣表現領先,且為唯一支持“聲音復刻”的評測系統。

在標準化測試中,Seed LiveInterpret 2.0在中譯英(zh-en)與英譯中(en-zh)任務中均取得了最高的BLEURT和COMET得分,同時在延遲指標AL(Average Lagging)、LAAL和FLAL上展現出良好平衡。

尤其在語音到語音(S2S)任務中,Seed LiveInterpret 2.0在zh-en方向取得60.7/83.6的得分,在en-zh方向取得57.6/83.5的得分,并以2.17秒的FLAL達成最低延遲,整體表現領先同類系統。


▲圖示為客觀測評集的測評成績,由于業界適合同傳場景的高質量公開測試數據較少,字節Seed團隊整合了公開數據與內部數據集進行測試。(圖源:字節跳動Seed)

結語:語言不再隔閡,AI真正走上同傳舞臺

從延遲、譯準率到音色復刻,Seed LiveInterpret 2.0已讓AI在同傳這條“最難登頂”的語言技術路徑上邁出了關鍵一步。技術側依托多模態訓練與強化學習策略,產品層面則已具備跨語言實時演講、跨境會議、教育直播等落地能力。

盡管目前仍僅支持中英互譯,但這套端到端同傳框架的可擴展性,為后續多語種拓展、情緒模仿和更多交互形式的翻譯任務奠定了基礎。

當“聽懂你說什么”與“像你說出來”同時成為可能,語言AI正在告別輔助工具的角色,真正走向人與人溝通的前臺舞臺。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普拿不到訪華邀請?中美談判再出意外,貝森特放出兩大殺招

特朗普拿不到訪華邀請?中美談判再出意外,貝森特放出兩大殺招

時時有聊
2025-07-26 06:26:05
百億身家的杜建英,為什么非要毀掉宗慶后維持多年的體面?

百億身家的杜建英,為什么非要毀掉宗慶后維持多年的體面?

未曾青梅
2025-07-22 22:24:32
蔣介石手下有3名“飯桶”,但凡少用一個,都不至于輸得那么慘

蔣介石手下有3名“飯桶”,但凡少用一個,都不至于輸得那么慘

墨斗魚紀事
2025-07-25 10:45:00
至今,還有13個國家和中國沒有建交,他們都是誰?

至今,還有13個國家和中國沒有建交,他們都是誰?

七號說三國
2025-06-04 19:05:13
記者:阿森納向羅德里戈團隊明確表示,不會滿足其薪資要求

記者:阿森納向羅德里戈團隊明確表示,不會滿足其薪資要求

直播吧
2025-07-26 04:35:04
這才是杜月笙孟小冬真實樣貌,并非演員扮演,貨真價實的珍貴照片

這才是杜月笙孟小冬真實樣貌,并非演員扮演,貨真價實的珍貴照片

淼犇小牛
2025-07-14 20:41:44
公務員和事業編的區別:800萬金飯碗與4000萬銀飯碗的11維度對比

公務員和事業編的區別:800萬金飯碗與4000萬銀飯碗的11維度對比

娛樂的宅急便
2025-07-26 00:17:57
完全取消養老金掛鉤調整,北京方案做到了!細節曝光,贊揚聲一片

完全取消養老金掛鉤調整,北京方案做到了!細節曝光,贊揚聲一片

社保精算師
2025-07-24 20:17:17
網紅羅大美遇害案將再開庭,家屬稱新增證據線索!不接受賠償

網紅羅大美遇害案將再開庭,家屬稱新增證據線索!不接受賠償

南方都市報
2025-07-25 19:29:18
股票一旦出現“巨量陰線”洗盤,毫不猶豫買入,拉升行情就要來了

股票一旦出現“巨量陰線”洗盤,毫不猶豫買入,拉升行情就要來了

股經縱橫談
2025-07-25 20:30:12
美方施壓,馬國撤回部署華為芯片聲明,但全球沒想到,中方動真格了

美方施壓,馬國撤回部署華為芯片聲明,但全球沒想到,中方動真格了

史韻流轉
2025-07-25 09:24:54
你曾看到空乘做過的最傻的事情是什么?網友分享空乘趣事大盤點

你曾看到空乘做過的最傻的事情是什么?網友分享空乘趣事大盤點

特約前排觀眾
2025-07-26 00:10:03
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
越是上流人越“下流”?人民日報撕下司馬南體面,3大污點洗不清

越是上流人越“下流”?人民日報撕下司馬南體面,3大污點洗不清

火之文
2025-07-24 17:26:43
山西省太原市人大常委會原副主任王劍峰被“雙開”

山西省太原市人大常委會原副主任王劍峰被“雙開”

界面新聞
2025-07-25 18:06:06
外交部:中國-歐盟領導人會晤達成重要共識

外交部:中國-歐盟領導人會晤達成重要共識

中國青年報
2025-07-25 20:16:05
已確認:全部關閉!全面退出中國市場

已確認:全部關閉!全面退出中國市場

中吳網
2025-07-24 23:03:08
楊瀾:我與老公早已無愛,若繼續再在一起,對彼此都是很不公平的

楊瀾:我與老公早已無愛,若繼續再在一起,對彼此都是很不公平的

今墨緣
2025-07-22 15:41:02
再次提級調查!東北大學6名大學生溺亡原因初步查明

再次提級調查!東北大學6名大學生溺亡原因初步查明

燕梳樓頻道
2025-07-25 12:36:54
《黑白大廚》遭中國「整鍋端去抄」! 韓Netflix發聲:從未授權

《黑白大廚》遭中國「整鍋端去抄」! 韓Netflix發聲:從未授權

ETtoday星光云
2025-07-25 10:17:07
2025-07-26 07:31:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10196文章數 116807關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

手機
家居
游戲
時尚
軍事航空

手機要聞

真把天璣 9400+ 裝在「充電寶」上了?

家居要聞

環繞設計 空間動線合理

《無主之地4》已開發完畢進廠壓盤

今年夏天一定要有這件衣服,好看又復古!

軍事要聞

吳謙少將任中國駐埃及使館國防武官

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日喀则市| 济南市| 长治市| 望都县| 剑河县| 和平县| 益阳市| 大新县| 泉州市| 淮滨县| 绥阳县| 策勒县| 响水县| 双峰县| 桂阳县| 宜丰县| 诸暨市| 安吉县| 西乌珠穆沁旗| 绥芬河市| 东台市| 张掖市| 梓潼县| 永年县| 扎鲁特旗| 大化| 蒙自县| 浠水县| 丰台区| 仲巴县| 紫金县| 南开区| 安宁市| 建始县| 隆昌县| 岑溪市| 林口县| 酒泉市| 崇义县| 读书| 清新县|