大數據文摘出品
2025 年 4 月,Meta 正式發布了 LLaMA 4 系列的首批兩款模型。
這兩款模型模型分別是:LLaMA 4 Scout 與 LLaMA 4 Maverick,均采用了 專家混合架構(Mixture-of-Experts, MoE)。
據 Meta 表示,這是首次有 LLaMA 模型實現 文字與圖像的統一處理能力,具備真正意義上的多模態理解。
據悉,在訓練過程中,系統最多可同時處理48 張圖像;而在后續評估中,模型在處理多達8 張圖像的輸入時,亦展現出穩定而強勁的視覺理解性能。
LLaMA 4 系列:有哪些新突破?
Meta 于本次 LLaMA 4 發布中亮相了兩款全新模型:
1. LLaMA 4 Scout
這是一款輕量卻不失強勁性能的模型,專為在單張 NVIDIA H100 GPU 上高效運行而優化,尤為適合科研人員與中小型企業應用。
擁有 1000 萬詞元(token)的超長上下文窗口,遠遠領先于多數現有開源大語言模型。
在推理、摘要生成與指令遵循等標準評測中,全面超越 Google 的 Gemma 3 與 Mistral 3.1。
2.LLaMA 4 Maverick
這款大型模型則劍指當前語言模型的重量級選手,如 GPT-4o、Claude 3.5 與 DeepSeek-V3。
精于代碼生成、多跳推理與高級搜索任務。
采用 專家混合機制(Mixture-of-Experts, MoE),僅激活部分參數進行計算,在保持卓越表現的同時顯著提升效率。
架構與創新亮點
兩款模型皆構建于全新的 Transformer 2.0 架構之上,并在多個關鍵維度進行了深度優化:
專家混合機制(MoE):每次前向傳播僅激活部分模型參數,有效降低計算開銷,同時不犧牲性能。
詞元流式處理與預測解碼(Speculative Decoding):顯著提升推理速度。
超長上下文窗口(Scout 模型支持高達 1000 萬詞元):可處理超大文檔或多輪對話,效率倍增。
多語言支持全面升級:在阿拉伯語、烏爾都語、西班牙語與中文等語言上的表現有了飛躍性提升。
Scout 在輕量級模型領域中一騎絕塵,而 Maverick 則在與 GPT-4o 和 Claude 等頂尖模型的競爭中依然鋒芒不減。
走向現實:LLaMA 4 的真實應用場景
Meta 推出的 LLaMA 4 不僅是科研成果的展示,更已廣泛融入旗下多個核心產品:
WhatsApp:用于客戶支持和智能回復
Messenger:實現 AI 內容摘要和上下文感知的消息交互
Instagram:應用于標題推薦、評論過濾與智能搜索
Meta.ai(網頁版):面向公眾開放的 AI 聊天助手,功能類似 ChatGPT 或 Claude.ai
開源”的邊界:開放,還是有限開放?
盡管 Meta 將 LLaMA 4 宣傳為“開源模型”,其使用許可仍存在一定限制:
月活躍用戶超過 7 億的企業 無權使用該模型
開源倡議組織(OSI) 批評其為“半開源”,因其限制了商業化的自由擴展
不過,學術界和獨立研究者 仍可訪問,意味著 AI 發展的透明度正朝積極方向邁進
下一站:LLaMA 4 Behemoth 即將登場
Meta 的發展藍圖中,還包括一款更具突破 性的全新模型 —— LLaMA 4 Behemoth(巨獸) 。
亮點一覽:
采用 專家混合架構(Mixture-of-Experts),在每次推理中僅啟用部分模型參數
總參數規模高達 2 萬億,每次推理激活參數約 2880 億
聚焦科學、數學、多語言推理與代碼生成等高復雜度任務
有望在 STEM 領域的基準測試中超越 GPT-4.5 與 Claude Sonnet 3.7
預計將在 2025 年 4 月 29 日的 LLaMACon(Meta 首屆開源 AI 大會)上正式發布
背后的雄心:打造 AI 基礎設施層
Meta 對人工智能的投入愈發激進,未來兩年預計投資將高達 650 億美元。
這不僅是對市場的回應,更體現出其打造“互聯網 AI 基礎設施層”的宏偉愿景。
LLaMA 4 的推出,標志著 Meta 不只是要與 OpenAI 和 Google 分庭抗禮,更要在開源領域取得主導地位。
LLaMA 4 系列的發布,堪稱開源 AI 生態的一次重大飛躍。
憑借其在效率、規模與可用性上的平衡,Meta 正在賦能全球開發者、初創企業與研究人員。
盡管許可政策仍有爭議,但 Scout 與 Maverick 的技術實力已贏得廣泛認可。
隨著 LLaMA 4 Behemoth 的臨近發布,以及 4 月 29 日 LLaMACon 的召開,
2025 正逐步成為“超級開源模型元年”,而 Meta,顯然已成為這場變革的領跑者。
via https://ai.plainenglish.io/metas-llama-4-series-10-million-context-length-is-here-pushing-the-frontier-of-open-source-ai-744c637084ae
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.