99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Mistral首個開源語音模型來了!全面碾壓Whisper,多項測試超越GPT-4o mini

0
分享至


智東西
作者 王涵
編輯 漠影

智東西7月16日消息,今日,谷歌和Meta前研究人員創立的AI初創公司Mistral AI,最新發布了首個開源語音模型:Voxtral語音理解模型系列

該模型包含24B和3B兩個參數規模的版本,均基于Apache 2.0許可證開源,同時提供API服務接口

Voxtral模型支持32k token的上下文窗口,能夠處理長達30分鐘的音頻轉錄任務或40分鐘的語義理解任務,在各項基準測試指標上全面超越目前主流的開源語音轉錄模型Whisper large-v3

Voxtral模型繼承了Mistral Small 3.1基座模型的文本理解能力,除了基礎的語音轉文字功能外,還可以直接對音頻內容進行問答交互,生成結構化摘要,并通過語音指令觸發API調用。

在公告中,Mistral還給出了幾個實例展現其語音生成能力,包括:

法國男人說法語:

https://oss.zhidx.com/bc5c551f5e78418ce996300229d3f173/68767b00/uploads/2025/07/68771da55bf0d_68771da5557f5_68771da5557ca_chat-fr.m4a

法國男人說英語:

https://oss.zhidx.com/b9d986efdf1a6a1775f86444f331168e/68767b00/uploads/2025/07/68771db31d1fe_68771db319648_68771db319622_chat-en.m4a

還可以加背景音,例如在喧鬧的大街上對話:

https://oss.zhidx.com/88b1d1a527869423a1ef311b8bf10feb/68767b00/uploads/2025/07/68771dbda9878_68771dbda5a08_68771dbda59e3_street.m4a

就連印地語混雜英語都能生成:

https://oss.zhidx.com/2dccd5f38674f04c90ac76962bbaf34b/68767b00/uploads/2025/07/68771dfe69e68_68771dfe657c3_68771dfe65788_audio-hi.m4a

在成本敏感型應用場景中,Voxtral Mini轉錄版的性能優于OpenAI Whisper,而使用成本僅為后者的50%以下。在高階應用場景中,Voxtral Small在保持與ElevenLabs Scribe相當性能水平的同時,使用成本同樣控制在后者50%以下


開發者可以在Le Chat上試用,通過Hugging Face平臺獲取模型進行本地部署,也可以使用云端API服務。

針對企業級應用,該模型支持私有化部署方案,可進行特定領域的微調適配,并提供高級上下文處理功能以及專屬集成支持。

未來兩周內Voxtral模型將在網頁和移動端的語音模式中向所有用戶推出。

一、轉錄能力全面碾壓Whisper,3項測試超越GPT-4o mini

在轉錄能力上,Voxtral通過多個英語及多語種基準測試進行驗證,每個任務的評測結果均采用跨語言宏平均詞錯率呈現,即數值越低越好。針對英語任務,還分別統計了短音頻(<30秒)和長音頻(>30秒)的平均表現。

結果顯示,Voxtral在各項指標上全面超越當前領先的開源語音轉錄模型Whisper large-v3。在英語短音頻,以及覆蓋多種語言和方言的大規模語音數據庫Mozilla Common Voice基準上,Voxtral Small超越Gemini 2.5 Flash與GPT-4o mini Transcribe,在英語長音頻測試上也超越了Scribe和GPT-4o mini Transcribe


在多語言基準測試FLEURS的評估中,Voxtral Small模型在所有任務上都超越了Whisper large-V3,并在法語和德語中占據榜單首位。


二、語音翻譯成績占據榜首,語音理解能力追平GPT-4o-mini、Gemini 2.5 Flash

為了更好地測試Voxtral Small和Mini版本的語音理解能力,Mistral的研究團隊將三項標準文本理解任務轉換為語音輸入形式,并構建了包含40個長音頻樣本的內部音頻理解基準(AU Benchmark),要求模型完成復雜問答任務。此外,還基于FLEURS-Translation基準測試了Voxtral的語音翻譯性能。

測試結果顯示,Voxtral Small在所有任務中與GPT-4o-mini及Gemini 2.5 Flash表現相當,并在語音翻譯任務FLEURS Translation中,超越GPT-4o-mini及Gemini 2.5 Flash,位列第一


在文本方面,Voxtral保留了其基座語言模型的文本處理能力,在各項文本測試中與Mistral Small 3.1成績相當,官方稱可直接替代Ministral和Mistral Small 3.1模型使用


結語:Voxtral表現超越開源項目,但難敵商業模型

Mistral AI發布的Voxtral語音模型系列為開源語音AI領域帶來了新的技術選擇。

從測試結果上看,該模型在轉錄準確率上超越了同為開源的Whisper,但其與商業模型GPT-4o-mini及Gemini 2.5 Flash還是有著一定的差距,Scribe依舊是語音模型中的“老大”。

Mistral AI在公告中還特別提到,未來幾個月,Voxtral模型的音頻處理能力還會持續增強,并且將新增說話人分割、音頻標記(如年齡和情緒)、詞級時間戳、非語音音頻識別等功能。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
0-3!邁阿密58天聯賽首敗 38歲梅西啞火:11天連踢4場太疲憊

0-3!邁阿密58天聯賽首敗 38歲梅西啞火:11天連踢4場太疲憊

葉青足球世界
2025-07-17 09:40:12
嵐圖汽車報案!“已初步指向某品牌代理商”

嵐圖汽車報案!“已初步指向某品牌代理商”

每日經濟新聞
2025-07-15 23:07:12
德魯茲之殤:以色列為何一腳踏進敘利亞的泥潭?

德魯茲之殤:以色列為何一腳踏進敘利亞的泥潭?

Wilsonhe8
2025-07-17 01:15:01
上海最貴?一碗面1588元,另收10%服務費,網友直呼:太瘋狂

上海最貴?一碗面1588元,另收10%服務費,網友直呼:太瘋狂

環球網資訊
2025-07-16 09:10:08
盧女士的事火到國外!外國美女主持人稱,這是對底層人尊嚴的踐踏

盧女士的事火到國外!外國美女主持人稱,這是對底層人尊嚴的踐踏

明月雜談
2025-07-16 20:11:33
來真的!利物浦殺瘋了:已正式與皇馬談判 報價1億歐求購24歲巨星

來真的!利物浦殺瘋了:已正式與皇馬談判 報價1億歐求購24歲巨星

風過鄉
2025-07-17 07:53:34
長沙男子砸記者設備被刑拘,完整視頻公布后輿論反轉:記者不是尋釁滋事?

長沙男子砸記者設備被刑拘,完整視頻公布后輿論反轉:記者不是尋釁滋事?

小蘿卜絲
2025-07-16 20:17:47
熱身賽:中國男籃2分惜敗荷蘭 上半場領先16分被逆轉王俊杰丟絕平

熱身賽:中國男籃2分惜敗荷蘭 上半場領先16分被逆轉王俊杰丟絕平

醉臥浮生
2025-07-17 08:13:29
宗馥莉叔叔過往被扒,沒一件事上得了臺面,沒被趕盡殺絕夠仁慈了

宗馥莉叔叔過往被扒,沒一件事上得了臺面,沒被趕盡殺絕夠仁慈了

娛小北
2025-07-16 21:09:54
印尼的豪賭大潰敗,給全世界提了個醒:中國行我也行,純粹是幻覺

印尼的豪賭大潰敗,給全世界提了個醒:中國行我也行,純粹是幻覺

近史談
2025-07-16 11:19:29
頭皮發麻!有人家中出現“巨型蟑螂”,網友:看起來有1米長

頭皮發麻!有人家中出現“巨型蟑螂”,網友:看起來有1米長

極目新聞
2025-07-15 21:20:15
四大銀行 8 月 1 日起:新型存款利率大改老百姓存款終于翻身了

四大銀行 8 月 1 日起:新型存款利率大改老百姓存款終于翻身了

錘不倒的拖油瓶
2025-07-17 05:41:33
五萬軍隊壓境,拉夫羅夫連夜抵京,普京向中國發出求助信號?

五萬軍隊壓境,拉夫羅夫連夜抵京,普京向中國發出求助信號?

流年拾光
2025-07-16 21:36:16
熱搜第一!16歲女孩飛機上產子,攜帶梅毒,李某蒔的悲劇再次上演

熱搜第一!16歲女孩飛機上產子,攜帶梅毒,李某蒔的悲劇再次上演

娜烏和西卡
2025-07-16 16:58:59
有重大立功表現,西藏自治區原黨委書記吳英杰賄受賄3.43億被判死緩

有重大立功表現,西藏自治區原黨委書記吳英杰賄受賄3.43億被判死緩

界面新聞
2025-07-16 17:09:21
成本超2.8億,預售票房僅483萬,打不過大鵬,姜文要敗走暑期檔?

成本超2.8億,預售票房僅483萬,打不過大鵬,姜文要敗走暑期檔?

靠譜電影君
2025-07-15 18:20:32
后續來了!游客公布行車記錄儀,警方通報已和解,牧民被批評教育

后續來了!游客公布行車記錄儀,警方通報已和解,牧民被批評教育

譚談社會
2025-07-16 21:47:24
催生失敗后,國家徹底換路子了!專家的 “新思路” 得到認可?

催生失敗后,國家徹底換路子了!專家的 “新思路” 得到認可?

詩意世界
2025-07-16 09:47:05
太炸裂!宗慶后不止4個孩子,兩任妻子均離婚,宗繼昌差點進家譜

太炸裂!宗慶后不止4個孩子,兩任妻子均離婚,宗繼昌差點進家譜

金石隨筆
2025-07-17 00:18:42
宗馥莉、杜建英都不值一提!娃哈哈員工再爆猛料:她才是真厲害

宗馥莉、杜建英都不值一提!娃哈哈員工再爆猛料:她才是真厲害

趣味萌寵的日常
2025-07-16 21:30:01
2025-07-17 11:20:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10163文章數 116800關注度
往期回顧 全部

科技要聞

不只H20?黃仁勛:希望對華銷售更好的芯片

頭條要聞

特朗普宣布終止資助美國高鐵:耗費數千億美元無法交付

頭條要聞

特朗普宣布終止資助美國高鐵:耗費數千億美元無法交付

體育要聞

不給楊瀚森傳球,他有自己的理由

娛樂要聞

都美竹將參加綜藝,單身媽媽發文抵制

財經要聞

宗氏三兄妹在港起訴宗馥莉文書曝光

汽車要聞

8月初上市 長安第三代UNI-V勁擎型嘗鮮價11.49萬

態度原創

本地
親子
健康
數碼
軍事航空

本地新聞

“別墅里面唱K”怎么就成了臺灣人的跳舞開關

親子要聞

行~女兒在爸爸懷里撒嬌要玩具,爸爸不語,只是一味說“行” #睡個好覺

呼吸科專家破解呼吸道九大謠言!

數碼要聞

磐鐳公布 Link S-3 雷電 5 顯卡塢完整規格,兼容 180mm ATX 電源

軍事要聞

胡塞武裝稱襲擊以色列多處目標 致其“航班中斷”

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宁武县| 义马市| 德兴市| 哈巴河县| 余干县| 婺源县| 保亭| 高唐县| 霍州市| 江都市| 浮山县| 文登市| 洞口县| 永清县| 江川县| 菏泽市| 肃宁县| 蒲城县| 固镇县| 宣武区| 武陟县| 盐城市| 江安县| 噶尔县| 石狮市| 嘉善县| 乐平市| 濮阳市| 成武县| 湖北省| 红安县| 眉山市| 神木县| 凤翔县| 长沙县| 板桥市| 太和县| 雷州市| 深泽县| 定州市| 安吉县|