網易首頁 > 網易號 > 正文申請入駐

剛剛，字節掏出AI同傳模型王炸，2秒延遲，0樣本復刻你的聲音，一手實測來了

2025-07-24 18:37:24　來源: 智東西

北京舉報

分享至

智東西
作者江宇
編輯漠影

智東西7月24日報道，今日，字節跳動Seed團隊正式推出端到端同聲傳譯模型Seed LiveInterpret 2.0。

這是首個在翻譯準確率、語音延遲與聲音復刻三方面同時逼近專業同傳表現的產品級中英語音同傳系統。

在中英互譯任務中，Seed LiveInterpret 2.0已達到業界最優水平（SOTA），其譯文質量、響應速度與音色還原能力，在多項主客觀評測中均表現突出。

該系統采用全雙工語音理解與生成框架，支持“邊聽邊說”的實時傳譯，語音延遲最低可至2到3秒。同時，它具備0樣本聲音復刻能力，無需預錄音，即可用說話者的音色“說出”外語。

當前，Seed LiveInterpret 2.0已通過火山引擎開放試用，用戶可登錄控制臺體驗語音模型“Doubao-同聲傳譯2.0”。

此外，Ola Friend耳機也計劃于8月底接入該系統，成為首個支持其語音同傳能力的硬件設備。

技術報告與體驗指路：

技術報告：
http://arxiv.org/pdf/2507.17527

項目主頁：
https://seed.bytedance.com/seed_liveinterpret

體驗鏈接：登錄火山引擎后，選擇語音模型“Doubao-同聲傳譯2.0”
https://console.volcengine.com/ark/region:ark+cn-beijing/experience/voice?type=SI

一、全雙工語音生成框架，實現真正“邊聽邊說”

字節Seed團隊曾在2024年推出初代模型CLASI，解決了文本同傳的時延與專業性問題，但仍不支持語音輸出。

時隔一年，團隊在模型結構、語音生成與訓練策略上持續優化，最終推出Seed LiveInterpret 2.0，首次實現“邊聽邊說”的語音到語音同傳。

Seed LiveInterpret 2.0引入了雙通路（duplex）語音理解與生成架構，這一端到端方案減少了中間環節，在處理效率和翻譯準確率上表現更優。系統能邊接收源語言語音輸入，邊生成目標語言語音輸出，且可實時處理多人說話場景。

▲Seed LiveInterpret 2.0的雙通路（duplex）語音理解與生成架構（圖源：字節跳動Seed）

尤其值得注意的是，相比傳統同傳系統需等待語音識別完成再生成譯文，Seed LiveInterpret 2.0可在聽音過程中同步生成目標語音，實現平均約2.5秒內完成首個譯句輸出（FLAL），顯著接近人類同傳表現。

▲圖為語音到語音同傳任務中，Seed LiveInterpret 2.0與主流系統在翻譯質量與延遲表現上的對比。（圖源：技術報告）

實測結果顯示，其語音翻譯延遲可低至2到3秒，相比傳統機器同傳系統平均減少了超過60%的等待時間，實現真正的“邊聽邊說”。

二、強化學習上場，翻譯更智能、延遲再壓縮

盡管早期版本Seed LiveInterpret 1.0在文本同傳已有不俗表現，但如何兼顧音頻輸出的節奏感與準確度，始終是AI同傳系統的關鍵難題。

為此，字節Seed團隊引入強化學習機制，在延遲、譯文準確率和節奏控制上進行聯合建模優化。

據技術報告描述，團隊設計了融合單步反饋與全局反饋的雙重獎勵機制，分別用于保障片段級語義一致性和整體譯文的邏輯連貫性。

在訓練方法上，團隊采用了兩階段流程：先通過單步獎勵預熱模型，學習人類譯員的翻譯策略，再利用全局獎勵機制優化模型對整體語義與響應延遲的控制。

這一機制顯著降低了模型生成輸出的滯后時間。如在長文本中譯英任務中，經過RL優化后的Seed LiveInterpret 2.0將語音輸出延遲從3.90秒降至2.37秒，翻譯質量得分也從75.1提升至79.5。

▲圖為RealSI長文本同傳基準下的系統性能對比（圖源：技術報告）

模型還具備自適應節奏控制能力，能夠根據語音輸入的清晰度與表達節奏，智能調整輸出時機與語速。

在長時間演講等場景中，系統會主動保持譯文與源語的節奏一致，避免“跟不上講話節奏”或“提前結束”等不同步問題。

三、0樣本聲音復刻，譯音既準又像“你”

Seed LiveInterpret 2.0引入“0樣本聲音復刻”能力，只需實時采樣對話語音，系統便能學習并克隆用戶的音色特征，以“原聲”輸出目標語種譯文。這一能力在真實會議、演講、跨語種溝通中極具實用價值，不僅降低理解門檻，也增強語義情緒的傳達。

在多輪語音評測中，Seed LiveInterpret 2.0是唯一支持“中英雙向語音到語音同傳+聲音克隆”的系統，其SVIP（語音譯文有效信息比例）在zh-en方向達到67.8，在en-zh方向達到64.7，音質、節奏、語調高度擬人。

▲圖為語音到語音同傳任務中，Seed LiveInterpret 2.0與主流系統在SVIP（語音譯文有效信息比例）上的對比。（圖源：技術報告）

得益于Seed LiveInterpret 2.0的聲音復刻能力，用戶在與不同語言背景的人交流時，依然能用自己的音色輸出外語譯文，在提升識別度的同時，也增強了交流的親和力。

智東西第一時間進行了試用，在“同聲傳譯”的過程中，系統對英文語音的翻譯響應較快，音色復刻也具備一定相似度，能聽出說話者的語氣。

但整體仍存在一定延時感，特別在語速變化或語句較長時更為明顯。

四、專業評測驗證：翻譯準確率達74.8分

為評估系統性能，字節Seed團隊基于中英雙向RealSI標準數據集，邀請專業同傳譯員團隊進行人工打分。

結果顯示，在語音到語音翻譯任務中，其譯音質量得分達66.3，顯著超過同類系統。在語音到文本的中英互譯任務中，Seed LiveInterpret 2.0的平均翻譯質量得分為74.8（滿分100），相比第二名系統高出58%。

▲圖示為語音到文本（S2T）和語音到語音（S2S）同傳任務中，人工評測的翻譯質量與響應效率結果。其中部分商業翻譯系統以字母代稱。（圖源：字節跳動Seed）

同時，在延遲方面，語音到文本場景中平均輸出首字延遲僅為2.21秒，語音到語音場景延遲為2.53秒，展現了質量與速度的良好平衡。

系統在BLEURT、COMET等客觀翻譯指標上同樣表現領先，且為唯一支持“聲音復刻”的評測系統。

在標準化測試中，Seed LiveInterpret 2.0在中譯英（zh-en）與英譯中（en-zh）任務中均取得了最高的BLEURT和COMET得分，同時在延遲指標AL（Average Lagging）、LAAL和FLAL上展現出良好平衡。

尤其在語音到語音（S2S）任務中，Seed LiveInterpret 2.0在zh-en方向取得60.7/83.6的得分，在en-zh方向取得57.6/83.5的得分，并以2.17秒的FLAL達成最低延遲，整體表現領先同類系統。

▲圖示為客觀測評集的測評成績，由于業界適合同傳場景的高質量公開測試數據較少，字節Seed團隊整合了公開數據與內部數據集進行測試。（圖源：字節跳動Seed）

結語：語言不再隔閡，AI真正走上同傳舞臺

從延遲、譯準率到音色復刻，Seed LiveInterpret 2.0已讓AI在同傳這條“最難登頂”的語言技術路徑上邁出了關鍵一步。技術側依托多模態訓練與強化學習策略，產品層面則已具備跨語言實時演講、跨境會議、教育直播等落地能力。

盡管目前仍僅支持中英互譯，但這套端到端同傳框架的可擴展性，為后續多語種拓展、情緒模仿和更多交互形式的翻譯任務奠定了基礎。

當“聽懂你說什么”與“像你說出來”同時成為可能，語言AI正在告別輔助工具的角色，真正走向人與人溝通的前臺舞臺。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

阿里AI三連發，釋放了哪些關鍵信號？

每日經濟新聞 2025-07-25 21:06:11
3 跟貼 3
上交校友發現AI思考越久輸出越差，挑戰推理越多輸出更好傳統觀點

DeepTech深科技 2025-07-25 18:24:38
0 跟貼 0

太坑了！外賣平臺AI商家泛濫，4招教你識破“幽靈外賣”真身

雷科技 2025-07-25 23:18:30
6 跟貼 6

AI應用時代，與巨頭共舞

鈦媒體APP 2025-07-25 18:27:26
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0

胖翻譯吃西瓜不想給錢沒曾想看到賣西瓜的當場直接嚇傻

百事影視君 2025-07-24 14:10:07
13 跟貼 13

豪門岳父被自家翻譯坑了不料農村女婿精通八國語言

艾尼剪影 2025-07-23 12:25:02
0 跟貼 0
獨女身份坐實，宗馥莉王炸證據公開！

品牌頭版 2025-07-25 17:55:51
627 跟貼 627

每一幕皆可控！字節發布多主體視頻生成神器，人人皆主角

量子位 2025-06-13 17:12:08
7 跟貼 7
DeepSeek用的GRPO占用大量內存？有人給出了些破解方法

機器之心Pro 2025-02-07 14:49:06
1 跟貼 1
豆包的野心已經浮出水面

鈦媒體APP 2025-07-24 10:17:38
0 跟貼 0
“專為我開了一個新課題”，頂尖博士為什么偏愛去字節實習？

機器之心Pro 2025-03-10 18:59:01
0 跟貼 0
南昌會議旅行社哪家強？綜合實力口碑佳推薦

江西旅游資訊 2025-07-24 11:17:25
0 跟貼 0
《掃毒風暴》盧少驊變土豪追小啞巴，馬英子這下懸了

瀟灑的慫熊 2025-07-26 05:59:22
1 跟貼 1
好不容易等來了的翻譯，沒想到是火上澆油

魚餅沒有魚 2025-07-22 16:50:08
1 跟貼 1
現役足壇十大射手近日，數據網站opta更新了足壇現役前十射手榜！

左腳爆射得分 2025-07-24 10:44:40
0 跟貼 0
青年志愿者的鏈博會故事（我在中外交流第一線）

金臺資訊 2025-07-26 06:00:19
0 跟貼 0
“翻譯這個，我工資是你的”總監嘲笑道，門衛兒子用五種語言翻譯

海星動畫 2025-07-22 13:49:18
0 跟貼 0
徐志勝又有新梗！脫口秀吐槽回家過年，文本太強無人能敵

點點說娛 2025-07-25 09:52:50
0 跟貼 0
五代機銹跡背后的技術困境，從F-35C涂層危機看裝備發展邏輯

虎說虎侃本人 2025-07-24 22:37:55
0 跟貼 0
河南幫扶人員68張白條2.8萬元餐館欠款已結清，縣糧食局簽字人：深表歉意，自己先墊的錢

極目新聞 2025-07-25 11:40:21
26963 跟貼 26963
金燦榮教授：我得不到的，你也別想得到！這就是西方邏輯？

遙遠與晴 2025-07-24 00:36:22
2 跟貼 2
現在還可以買房嗎？一條視頻告訴你買房的邏輯和真相

來訪曼 2025-07-23 03:10:52
11 跟貼 11
女子為過戶奶奶名下手機號，辦“奶奶是爸爸的媽媽、爸爸是我的爸爸”證明后，得到回復：派出所公章不清晰

大風新聞 2025-07-25 12:32:20
15874 跟貼 15874
笑岔氣了！何廣智文本無敵，笑點太密集了，聽了一遍又一遍

騎著蝸牛追導彈85 2025-07-25 09:40:00
9 跟貼 9
單日發起40次沖鋒，紅軍村正式被俄軍占領，俄烏戰爭結束近在眼前

南宮一二 2025-07-25 02:38:17
4914 跟貼 4914
中國男籃大勝委內瑞拉，數據一目了然，不是趙睿，最大功臣是他！

貓meme團子 2025-07-25 04:04:10
0 跟貼 0
輕松一刻：連寫5天，我實在太想進步了

輕松一刻 2025-07-25 17:31:27
1151 跟貼 1151
為什么沒人出來懟懂車帝？

一口老炮 2025-07-25 15:13:18
2348 跟貼 2348
博主吐槽潿洲島亂收費，除了呼吸都要錢，島上民宿老板炸鍋了

凡知 2025-07-25 12:13:22
1247 跟貼 1247
泰軍重裝甲師抵達泰柬邊境集結大量裝甲車陸續進場

臺海青年 2025-07-25 19:13:59
3183 跟貼 3183
劇中王志文天道的邏輯現實可用嗎

草花影視 2025-07-24 10:06:38
5 跟貼 5
理想L6給不了的，嵐圖FREE+給，理想L6照顧不到的，嵐圖FREE+照顧

買車大師 2025-07-25 22:01:07
0 跟貼 0
四十年博弈，這些年太不容易了（音頻：靜思有我）

張八筒筒 2025-07-25 08:45:31
0 跟貼 0
物美、美團爭當“中國奧樂齊” 線下“硬折扣”新賽季開打

每日經濟新聞 2025-07-25 23:37:10
0 跟貼 0
小黛玉這思維邏輯太清晰了，博士爸爸反被上了一課～哈哈哈

龍眼嘮生活 2025-07-25 09:09:43
0 跟貼 0
完蛋！涿州又被洪水包圍了

瑪麗姬絲 2025-07-25 22:44:08
4803 跟貼 4803
什么是消失模鑄造？鐵水倒進去模型消失了，發生了有趣的現象

繪生繪攝 2025-07-25 20:40:00
0 跟貼 0
事實證明：有激光雷達的新勢力，智駕干不過靠攝像頭的特斯拉

車快評 2025-07-26 00:15:22
6 跟貼 6
6名大學生溺亡事件更多細節披露車間主任：校企都沒做過專項安全檢查

上游新聞 2025-07-25 14:32:26
2811 跟貼 2811

智東西

聚焦智能變革，服務產業升級。

10196文章數 116807關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

家居

游戲

時尚

軍事航空

手機 / 數碼

房產 / 家居

剛剛，字節掏出AI同傳模型王炸，2秒延遲，0樣本復刻你的聲音，一手實測來了

36款熱門車高危智駕場景測試，“團滅”！

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

3年過去了，她還是歐洲杯上最酷的姐

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

劉煜輝:當下重要不是找確定性而是轉折點

李斌一口氣講了近3個小時樂道L90 原因是為啥？

態度原創

真把天璣 9400+ 裝在「充電寶」上了？

環繞設計 空間動線合理

《無主之地4》已開發完畢進廠壓盤

今年夏天一定要有這件衣服，好看又復古！

吳謙少將任中國駐埃及使館國防武官

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器官方介入

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器官方介入

環繞設計空間動線合理