整理 I 褚杏娟
當?shù)貢r間 5 月 7 日,法國 AI 初創(chuàng)公司 Mistral AI 宣布推出新模型 Mistral Medium 3??偟膩碚f,新模型有三個亮點:
引入一個全新的模型類別,兼顧 SOTA 性能、成本大降 87.5%,并以支持以更簡單的部署方式,加速企業(yè)落地應用。
在編程和多模態(tài)理解等專業(yè)場景中表現(xiàn)突出。
具備一系列企業(yè)級功能,包括:混合部署或本地 / 虛擬私有云(VPC)部署、定制化的后訓練及可集成至企業(yè)工具和系統(tǒng)中。
據(jù)官方介紹,在各項基準測試中,Mistral Medium 3 能達到或超過 Claude Sonnet 3.7 的 90%,但成本卻低得多(每百萬 token 輸入 0.4 美元 / 輸出 2 美元)。定價方面,無論是 API 還是自部署系統(tǒng),該模型優(yōu)于 DeepSeek V3 等模型。
“在性能方面,該模型超越了領先的開源模型(如 Llama 4 Maverick)以及企業(yè)級模型(如 Cohere Command A)。在價格方面,它也優(yōu)于 DeepSeek V3 等低價模型,無論是在 API 使用還是自部署系統(tǒng)方面都更具優(yōu)勢?!惫俜奖硎?。
據(jù)介紹,Mistral Medium 3 在編碼和 STEM 任務中尤其突出,在這些任務中,它的表現(xiàn)與參數(shù)大但速度慢得多的競爭對手相差無幾。
除了學術(shù)基準測試外,Mistral 還發(fā)布了更能代表實際用例的第三方人工評測。“Mistral Medium 3 在編碼領域繼續(xù)大放異彩,其全面性能遠超一些參數(shù)規(guī)模更大的競爭對手?!?/p>
此外,Mistral Medium 3 支持在任意云平臺部署,包括配置為四塊 GPU 及以上的自托管環(huán)境。
“可惜 Mistral 已經(jīng)過時了。寫小說效果差,編程還行,但也不算特別出色。Qwen 3 30B、Gemma 3 27B、GLM-4 很難被超越?!庇芯W(wǎng)友評價道。
失去了開源口碑
2023 年 9 月,開源 Mistral 7B 模型以超越同量級競品的性能和選擇開放性的 Apache 2.0 許可證引發(fā)社區(qū)轟動,這也讓這家剛成立不久的大模型公司迅速進入公眾視野。
Mistral 并非所有模型都開源,這無可厚非。問題是,自 Mistral 7B 后, Mistral 再沒有一個拿得出手的開源模型。而 Mistral 更先進模型的應用,例如其廣受好評的一款新編程工具,目前僅在商業(yè)平臺上銷售,且已經(jīng)與微軟、亞馬遜和谷歌達成了云分銷協(xié)議。以至于,網(wǎng)友都在呼吁 Mistral 趕緊出下一個開源模型。
“非本地版本,沒有開放權(quán)重,無法與 Qwen3 進行比較,又一個不相關(guān)的版本。” Medium 3 發(fā)布后網(wǎng)友 AaronFeng47 給出的評價。
對于 Mistral 在官博中寫的“即便是我們的中等規(guī)模模型,在性能上也遠超旗艦級開源模型(如 Llama 4 Maverick),我們對未來‘開放’發(fā)布的內(nèi)容充滿期待。”有網(wǎng)友怒道:
“開放”是吧?他們的行為真的有些奇怪。最初在1 月 30 日那篇博客文章中,他們讓社區(qū)充滿期待,仿佛要從他們專有的“開放權(quán)重”許可MRL轉(zhuǎn)向 Apache-2.0 許可:“我們重申對在通用模型上使用 Apache 2.0 許可的承諾,并將逐步淘汰 MRL 許可的模型。 ”
然而在接下來的四個月時間里,他們至少發(fā)布了三款更加受限的“開放權(quán)重”模型(Saba、Mistral OCR 和 Mistral Medium 3),這些模型僅能供企業(yè)客戶在本地自托管部署。
如果不是因為他們對“承諾”的不斷漠視,我也不會因此指責他們。搞笑的是,他們在這段期間里幾乎只發(fā)布了一款真正開源的模型——Mistral Small 3.1(相較 Mistral Small 3 只是小幅更新),而社區(qū)對此反響平平。
“現(xiàn)在我希望他們能發(fā)布一個開源權(quán)重模型,其質(zhì)量至少能與 GPT-4.1 mini 相媲美,但模型規(guī)模最多與當前的 Mistral Small 一樣,或者如果是 MoE 模型,則規(guī)??膳c新推出的 Qwen 3 30B A3B 相當。我們總可以做個美夢,對吧?”有網(wǎng)友諷刺道。
在 AI 領域,一年是很長的時間。隨著人們發(fā)現(xiàn) Mistral 在 AI 競賽中難以追趕更大規(guī)模的競爭對手,大家最初的熱情開始冷卻。
成也“高效率”,敗也“高效率”?
Mistral AI 的三位創(chuàng)始人都有在美國大型科技公司從事 AI 研究的背景,這些公司在巴黎也有重要業(yè)務。CEO Arthur Mensch 曾在 Google 的 DeepMind 工作,CTO Timothée Lacroix 和首席科學官 Guillaume Lample 則是前 Meta 員工。這三個人被譽為“將歐洲最終推上科技頂尖舞臺的英雄。”
“我們曾協(xié)助他們進行早期融資,并在公司架構(gòu)初期提供支持……但真正去執(zhí)行這些的,還是他們自己,”巴黎健康保險初創(chuàng) Alan 創(chuàng)始人兼 CEO Jean-Charles Samuelian-Werve 說道,“對于歐洲在生成式 AI 領域?qū)崿F(xiàn)戰(zhàn)略自主的想法固然重要,但 Mistral 更希望成為一個全球性的佼佼者?!?/p>
Mistral 一直將成本效率視為最大的優(yōu)勢?!拔覀兪褂玫乃懔Ρ让绹偁帉κ稚倭?100 倍,但我們已經(jīng)能夠開發(fā)出幾乎處于前沿水平的模型,”Mensch 在接受《金融時報》采訪時表示。
這一策略為 Mistral 贏得了包括微軟在內(nèi)的支持者。微軟與該初創(chuàng)公司簽署了合作協(xié)議并入股少量股份,這是微軟在 OpenAI 之外對大模型公司的首筆投資?;鶞蕼y試網(wǎng)站(如 RankedAI.co)也將 Mistral 列為全球十大模型開發(fā)者之一。
但 Mistral 正在被包括 DeepSeek 在內(nèi)的新興競爭對手超越。經(jīng)濟咨詢公司 Entext 創(chuàng)始人 Sean Maher 表示:“中國無疑已經(jīng)接過了這一接力棒,成為 OpenAI 及其美國競爭對手的‘快速追隨者’?!彼麑?DeepSeek 的最新模型 V3 稱為“令人瞠目結(jié)舌的時刻”,并認為“它將改變整個行業(yè)的經(jīng)濟格局”。
盡管一些支持者認為這證明了 Mistral 的做法是正確的,但也有人認為這是對其提供負擔得起的“開放”AI 商業(yè)模式的威脅。甚至一些歐洲科技創(chuàng)始人和投資者認為,在前沿大模型開發(fā)者幾乎可以獲得無限資本的時期,Mistral 選擇聚焦“高效率”是一種戰(zhàn)術(shù)上的失誤。
“全歐洲的希望”最好的歸宿是“賣身”?
法國總統(tǒng)馬克龍也對這家初創(chuàng)公司給予了熱情支持,他被 Mistral “主權(quán)化”且更“開放”的 AI 承諾所吸引,非常認同其完全獨立于美國大型科技公司的定位。歐盟在 2023 年底討論其首部旗艦人工智能法規(guī)時,馬克龍等人還警告布魯塞爾政府不要用過多的繁文縟節(jié)來阻礙這一新興行業(yè)的發(fā)展。
盡管歐洲還有一些前景可期的 AI 初創(chuàng)公司,如英國的 Wayve、德國的 DeepL 和 Black Forest Labs,以及法國的 Poolside,但目前沒有一家在開發(fā)大模型。曾被寄望成為德國本土大模型冠軍的 Aleph Alpha,去年已離開大模型領域,這使 Mistral 成為歐洲唯一的重量級選手。
隨著面臨著更大的競爭壓力,去年市場上開始傳出 Mistral 被收購的消息。
在今年的達沃斯論壇上,Mensch 回避了關(guān)于 Mistral 是否會像許多較小玩家那樣不得不出售給大型科技公司的提問。但他堅稱不會出售 Mistral,并希望公司有朝一日可以上市?!拔覀冋J為,作為一家獨立公司所做的事情非常重要,”他說道,“所以這不在考慮范圍內(nèi)。”
不過,一位 Mistral 投資人在私下里并不那么樂觀?!拔覀冮_始看到不好的征兆,”該人士說道,“他們需要出售自己?!?/p>
Mistral AI 成立不足兩年,卻已在去年 6 月完成了 6 億歐元的融資,估值接近 60 億歐元,但批評者認為該公司正處于 AI 初創(chuàng)企業(yè)的尷尬困境:籌資規(guī)模過大,無法悄然退出市場;但又不足以在全球 AI 競賽中保持領先地位。
目前,Mistral AI 的員工人數(shù)約為 150 人,而其美國競爭對手擁有數(shù)千名員工。
當被問及 Mistral 是否計劃在今年籌集更多資金時,Mensch 表示:“可能吧,盡管我們不一定需要。市場上確實已經(jīng)有人對此感興趣?!?/p>
Maher 預測,Mistral 的發(fā)展可能會效仿 Adept 和 Inflection 等 AI 初創(chuàng)企業(yè),最終被大型科技公司“人才收購”。不過,這種情況是否會發(fā)生,還取決于布魯塞爾的反壟斷監(jiān)管機構(gòu)是否允許這樣一個具有戰(zhàn)略意義的歐洲資產(chǎn)被美國買家收購?!靶蝿菀呀?jīng)發(fā)生變化,(Mistral)需要找準自己的定位,否則就會被淘汰。”
領先的 AI 企業(yè)已籌集了超過 500 億美元的資金——遠遠超過 Mistral
如今,Mistral AI 通過 Le Chat 的付費層來獲取部分收入。Le Chat Pro 計劃在今年 2 月推出,定價為 14.99 美元 / 每月。在 B2B 領域,Mistral AI 通過基于使用量定價的 API 來變現(xiàn)其旗艦模型。企業(yè)也可以為這些模型購買許可證,公司可能還從其戰(zhàn)略合作伙伴關(guān)系中獲得了可觀的收入份額。
熟悉 Mistral 財務狀況的投資者稱,其年化運行率 (ARR) 已達數(shù)千萬美元。與此同時,據(jù)報道,Anthropic 去年銷售額接近 10 億美元,而 OpenAI 的營收則接近 40 億美元。
硅谷風投公司 Menlo Ventures 的一項研究顯示,Mistral 在企業(yè)級 AI 市場中排名第五,去年市占率僅為 5%,不到 Google 或 Meta 的一半,遠遠落后于 OpenAI。
https://mistral.ai/news/mistral-medium-3
https://techcrunch.com/2025/05/05/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/?utm_source=chatgpt.com
https://www.ft.com/content/fa8bad75-dc55-47d9-9eb4-79ac94e54d82?utm_source=chatgpt.com
聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載
大模型如何啃下客服 / 財務 / 營銷“硬骨頭”?
3 位技術(shù)負責人親授:從實驗室到生產(chǎn)環(huán)境的「最后一公里」,看大模型在三領域?qū)嵺`,歡迎預約直播,屆時拍磚與交流。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.