只需一眨眼的功夫,Mercury 就把任務完成了。
「我們非常高興地推出 Mercury,這是首款專為聊天應用量身定制的商業級擴散 LLM!Mercury 速度超快,效率超高,能夠為對話帶來實時響應,就像 Mercury Coder 為代碼帶來的體驗一樣。」
剛剛,AI 初創公司 Inception Labs 在 X 上宣布了這樣一個好消息。該公司的創始人之一 Stefano Ermon 實際上也正是擴散模型(diffusion model)的發明者之一,同時他也是 FlashAttention 原始論文的作者之一。Aditya Grover 和 Volodymyr Kuleshov 皆博士畢業于斯坦福大學,后分別在加利福尼亞大學洛杉磯分校和康乃爾大學任計算機科學教授。
Mercury 效果如何?我們先看一個官方 Demo:
視頻顯示,一位用戶想要學習西班牙語。請求 Mercury 教他一些常見的問候語及其含義。幾乎一眨眼的功夫,Mercury 就給出了一些常見的西班牙語問候語及其含義,速度確實非常快。
一直以來,擴散模型是圖像生成和視頻生成的主流方法。然而,擴散模型在離散數據上的應用,特別是在語言領域,仍然僅限于小規模的實驗。與經典的自回歸模型相比,擴散模型的優勢在于其能夠進行并行生成,這不僅可以大幅提高生成速度,還能提供更精細的控制、推理能力和多模態數據處理能力。
然而,將擴散模型擴展到現代 LLMs 的規模,同時保持高性能,仍然是一個未解決的挑戰。
Mercury 就是為此誕生的,其是首個基于擴散模型的 LLM。與自回歸(AR)模型相比,Mercury 模型在性能和效率上都達到了最先進的水平。
在性能表現上,根據第三方測評機構 Artificial Anlys 的基準測試數據顯示,Mercury 可媲美 GPT-4.1 Nano 和 Claude 3.5 Haiku 等速度經過優化的前沿模型,同時運行速度提升超過 7 倍。
在其他場景下,Mercury 也展現出超強的能力。
首先在實時語音方面。Mercury 憑借其低延遲特性,能夠為各類實時語音應用提供支持,包括翻譯服務和呼叫中心代理等場景。在實際語音指令測試中,基于標準 NVIDIA 硬件運行的 Mercury,其延遲表現優于在 Cerebras 系統上運行的 Llama 3.3 70B 大模型。
其次是可交互性。Mercury 是微軟 NLWeb 項目的合作伙伴。與 Mercury 結合使用時,NLWeb 能夠提供閃電般快速、自然的對話。與其他注重速度的模型(例如 GPT-4.1 Mini 和 Claude 3.5 Haiku)相比,Mercury 的運行速度更快,確保了流暢的用戶體驗。
與此同時,Inception Labs 還發布了 Mercury 技術報告,感興趣的讀者可以前去了解更多內容。
- 論文標題: Mercury: Ultra-Fast Language Models Based on Diffusion
- 論文鏈接:https://arxiv.org/pdf/2506.17298
- 試用地址:https://poe.com/Inception-Mercury
我們不難看出,Mercury 是邁向基于擴散語言建模未來的下一步,它將用極其快速和強大的 dLLM 取代當前一代的自回歸模型。
既然 Mercury 主打速度快,效率高,那么真實體驗效果如何呢?機器之心上手體驗了一把。
一手體驗
首先測試一下 Mercury 的推理能力,兩個經典的問題「9.11 和 9.9 哪個大」「"Strawberry" 中有幾個字母 'r'?」都回答正確。
但在「紅綠色盲女孩的父親為什么崩潰」這個問題上敗下陣來。
接下來我們測試一下代碼能力,我們用 Mercury、Gemini 2.5 Flash、GPT 4.1 mini 生成同一個腳本任務,看看他們表現有什么區別。
「 生成一個 1000 字的 TypeScript 游戲腳本,包括角色類、攻擊邏輯、敵人 AI、UI 模塊初始化。 」
Mercury 生成過程:
Gemini 2.5 Flash 生成過程:
GPT 4.1 mini 生成過程:
可以看到,Mercury 確實生成速度非常快,在短暫幾秒停頓后,大量文本同時出現,任務完成僅僅用時幾秒,而 Gemini 和 GPT 生成的文字像打字機一樣一個接一個地流出,總耗時較長。
再來檢查一下生成質量怎么樣,這里邀請 GPT o3 作為評委老師。
可以看到,雖然 Mercury 生成速度很快,但生成質量還有待提高。
最后,我們還問了 Mercury 一些日常問題,回答速度非常快。
還沒體驗的小伙伴,可以去試一試了。
視頻鏈接:https://mp.weixin.qq.com/s/dSEkdYHOQbaiRN3O4D-hKg
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.