網易首頁 > 網易號 > 正文申請入駐

Llama 4多模態大模型上線即開源，測試成績、開源模式廣遭質疑

2025-04-07 22:06:22　來源: AI先鋒官

北京舉報

分享至

作者｜沐風

來源｜AI先鋒官

就在這周末，開源界元老Meta正式推出了首個原生多模態Llama 4系列模型，性能上全面超越GPT-4o、Gemini 2.0等頂級競品，同時支持1000萬token超長上下文。

該系列總共公布了3個模型，分別為Scout、Maverick和Behemoth。

在這三個模型中，Maverick、Scout都是從Behemoth上蒸餾得來，并且Scout和Maverick已經開源，可以在其官網和Hugging Face上進行下載。

據官方介紹，Llama 4是Meta迄今為止最先進的模型，也是同類產品中多模態性最強的模型。

另外，Llama 4模型是Llama系列模型中首批采用混合專家（MoE）架構的模型，也是DeepSeek系列模型采用的架構。

與傳統的稠密模型相比，在MoE架構中，單獨的token只會激活全部參數中的一小部分，訓練和推理的計算效率更高。

接下來，我們就一起看看Llama 4系列模型都有哪些亮點。

Llama 4 Scout

擁有170億活躍參數，總參數量為1090億。
配備了16個專家模塊，每次推理激活其中2個。
支持1000萬token上下文。
單張H100 GPU即可運行。
在基準測試中，其性能表現超過了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。

Llama 4 Maverick

同樣具備170億活躍參數，總參數量增加至4000億。
專家模塊的數量增加到128個，每次推理激活17個專家。
支持1000萬token上下文。
基準測試中，其性能表現超越了GPT-4o和Gemini 2.0 Flash。
在推理、編程、多語言等任務上媲美DeepSeek v3，但參數僅為其一半。
在LMArena測試中，ELO評分高達1417。

Llama 4 Behemoth

擁有2880億個活躍參數，總參數量接近2萬億。
具體有16個專家模型。
在多個 STEM 基準測試中優于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。
目前仍在訓練中，尚未公開發布。

值得一提的是，Llama 4 Maverick一經發布就沖上了LMArena排行榜中的第二名，僅僅比 Gemini-2.5-pro模型少22分，成為第四個突破 1400 分的大模型。

但這一成績卻引發了諸多質疑。

據多位AI研究人員在社交平臺X上指出，Meta在LMArena上部署的Llama 4 Maverick與廣泛提供給開發者的版本并不一致。

不過，Meta在其公告中明確提到，參與LMArena測試的Llama 4 Maverick是一個“實驗性聊天版本”。

而根據官方Llama網站上公布的信息，Meta 在LMArena的測試中所使用的實際上是“針對對話性優化的Llama 4 Maverick”。這表明，該版本經過了專門的優化調整，以適應 LM Arena 的測試環境和評分標準。

有AI研究人員在社交平臺X上指出，公開可下載的Maverick與LMArena上托管版本之間存在明顯行為差異。LMArena版本更傾向于使用大量表情符號并提供冗長的回答，這在標準版本中并不常見。

在實際使用中，很多人覺得Llama 4的編碼能力和數學邏輯方面都沒有測試中那么厲害，甚至有社區用戶給它進行了重新打分，重新打分后的Llama 4連前10都進不去。

在經典測試題“strawberry中有多少個R”的問題上，Llama 4 Maverick也未能做對。

據博主“karminski-牙醫”發布的評測結果顯示，Llama 4 Maverick與Qwen-QwQ-32B的寫代碼水平一致，Scout則是直接掛科。

其更是直言：“不建議用Llama 4寫代碼”。

看來，Llama 4這次更像是個“偏科生”，多模態和長文本是長板，但邏輯推理和代碼生成似乎還需要打磨。

除此之外，Llama 4的開源模式也遭質疑。

例如，油管知名博主1littlecoder就指出Llama 4的許可條款與真正的開源精神相去甚遠。

馬克·扎克伯格在Llama 4發布視頻中充滿熱情地宣布："今天是Llama 4的日子。我們的目標是構建世界領先的AI，將其開源，并使其普遍可訪問，讓全世界都能受益。我一直認為開源AI將成為領先模型，而隨著Llama 4，這開始變為現實。"

然而，1littlecoder直言不諱地表示："這是對開源的污蔑，與開源毫無關系。你可以稱它為開放模型，你可以稱它為開放權重模型，但它不是開源的。"

1littlecoder認為，開源軟件的基本原則之一是普遍可訪問性。開源通過開源或免費許可促進對產品的普遍訪問。這意味著任何人都應該能夠訪問你的產品，而不會有太多麻煩。"

與其他真正開源的AI模型相比，Llama 4的獲取過程顯得異常復雜。

1littlecoder提到，“Meta的模型要求你首先登錄Hugging Face賬戶，這點我能理解，他們可能有垃圾郵件問題。然后填寫表格，務必提供你的法定全名。我是說，為什么下載PyTorch權重或一些隨機二進制文件需要提供我的法定姓名？還有出生日期、完整的組織名稱、所有公司標識符?！?/p>

更令人擔憂的是，表格上明確警告：“避免使用首字母縮寫和特殊字符。未能按照這些指示操作可能會阻止你訪問此模型和Hugging Face上的其他模型。提交后，你將無法編輯此表格。因此，請確保所有信息準確無誤?！?/strong>

這意味著一旦因填寫信息不當被Meta禁止，用戶可能永遠無法從Hugging Face下載該模型，這與開源軟件的普遍可訪問性原則直接沖突。

更具爭議性的是Llama 4的社區許可協議。

1littlecoder更是將其描述為"對開源的污蔑"。

這份許可協議包含多項限制，直接挑戰了傳統開源定義：

首先是用戶限制條款：“如果你擁有一家月活躍用戶超過7億的公司，你不能使用這個模型。”雖然這對大多數開發者來說影響有限，但它違背了開源軟件不應對使用者有歧視的基本原則。

其次是關于再分發的嚴格要求。許可證規定，如果分發或提供Llama材料，必須顯示"使用Llama構建"的標志。

1littlecoder對此表示強烈不滿：“為什么我要這樣做？你想加速開源，對吧？你不是在尋求任何好處，因為你相信開源。只要給我模型，我想怎么用就怎么用。這是愚蠢，完全的愚蠢?！?/p>

更令人震驚的是命名要求：“如果你使用Llama材料或任何Llama材料的輸出或結果來創建、訓練、微調或以其他方式改進分發或提供的AI模型，你還應該在任何此類AI模型名稱的開頭包含‘Llama’?！?/p>

1littlecoder在結束時呼吁AI社區重新思考什么才是真正的開源：“請不要稱這為開源。我相信，將任何進入Hugging Face的愚蠢模型稱為開源，對于開源代表的內容或開源支持者來說，是一種污蔑。這不是開源，只是你可以下載并帶有一堆限制的開放權重?！?/p>

掃碼邀請進群，我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型，順便學一些AI搞錢技能。

往期文章回顧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網易首頁下載網易新聞客戶端

相關推薦

熱點推薦

差分注意力機制引領變革，DIFF Transformer攻克長序列建模難題

機器之心Pro 2025-04-29 11:03:19
25 跟貼 25

一搜秒回、多模態輸出，百度AI搜索全面上線百度智能云千帆平臺

量子位 2025-06-13 18:34:21
0 跟貼 0

每一幕皆可控！字節發布多主體視頻生成神器，人人皆主角

量子位 2025-06-13 17:12:08
2 跟貼 2

破解三大數據庫AI難題！北大&亞馬遜推出全球首個圖中心RDB基模

量子位 2025-06-15 12:34:33
2 跟貼 2

分割/識別/解說一個模型搞定！3B參數刷新視覺理解SOTA

量子位 2025-06-14 19:59:23
0 跟貼 0

對話開源中國馬越：DeepSeek不是國運級的創新，年輕人才是

36氪 2025-03-13 18:14:13
14 跟貼 14

美媒：伊朗之所以損失如此慘痛是因犯了一個大錯

環球時報新聞 2025-06-14 23:54:17
8323 跟貼 8323

研究人員打造知識圖譜補全新框架，可用于推薦系統和信息檢索

DeepTech深科技 2025-04-16 11:11:03
0 跟貼 0

字節選擇背水一戰

虎嗅APP 2025-06-14 16:28:06
9 跟貼 9

王天一的招數竟然比軟件厲害！棄馬妙手，景學義大師難以招架

暴力蛙 2025-06-12 14:46:00
1 跟貼 1

LF開源軟件學園五周年：感恩相伴，攜手前行

開源中國 2025-06-13 20:18:44
0 跟貼 0

o3-pro答高難題文字游戲引圍觀，OpenAI前員工諷刺蘋果

量子位 2025-06-13 11:31:08
9 跟貼 9

1953年毛主席罕見動怒，宣布一類文件無效

夜寒兮月孤靜 2025-06-15 05:52:12
0 跟貼 0

所有AI工具共享記憶！MCP協議無需云端，Cursor、Claude都能用

量子位 2025-05-14 14:00:47
56 跟貼 56

高志凱點破殖民陰影延續，呼吁擺脫過時強盜邏輯

精彩背后的故事 2025-06-13 23:43:48
1 跟貼 1

比你還像你的AI，來了！

華商韜略 2025-04-29 10:31:57
0 跟貼 0

奔馳車機大面積崩潰，OTA誤刪文件？

極果酷玩 2025-06-12 18:19:27
0 跟貼 0

AI智能體上線，營銷人下線？ | AI無悖論

虎嗅APP 2025-06-15 01:00:27
1 跟貼 1

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0

男人被公司裁員，老板給了他一個信封，回家火車上打開后他懵了

球場的看客 2025-06-15 17:09:21
1 跟貼 1

當大模型接入玩具 AI硬件與情緒消費殊途同歸？

財聯社 2025-06-15 08:24:12
8 跟貼 8

挖掘DiT位置解耦特性,Personalize Anything免訓練個性化圖像生成

機器之心Pro 2025-03-25 14:45:37
1 跟貼 1

為什么說AI“有用”才最重要？

新周刊 2025-03-25 22:43:55
0 跟貼 0

細節厘米級還原、實時渲染，MTGS方法突破自動駕駛場景重建瓶頸

機器之心Pro 2025-04-02 14:22:12
0 跟貼 0

再次跟中天說抱歉！“館長”：對中天有一分愧疚，我一直在彌補

海峽導報社 2025-06-14 21:35:02
598 跟貼 598

大模型能否讀懂病歷？哈佛醫學院發布BRIDGE大規模多語言評測基準

ScienceAI 2025-06-15 19:38:05
0 跟貼 0

伊朗首次解密以色列敏感文件，國際原子能機構被 “操控”？

河洛有話說 2025-06-13 17:16:30
1 跟貼 1

全球首次，Transformer「混血」速度狂飆65倍！英偉達已下注

新智元 2025-06-14 13:25:54
1 跟貼 1

自動學會工具解題，RL擴展催化奧數能力激增17%

機器之心Pro 2025-04-02 16:05:08
4 跟貼 4

全球程序員炸鍋！老黃倫敦放豪言：編程語言的未來是「Human」

新智元 2025-06-15 09:12:25
108 跟貼 108

Meta Horizo??n創作者大賽獲獎名單公開，總獎金100萬美元

VR陀螺 2025-06-13 17:55:04
1 跟貼 1

誰是開源界的杠把子？

虎嗅APP 2025-04-11 23:29:08
3 跟貼 3

一線城市近4000萬人租房，買房賺錢邏輯失效

大都督陸遜 2025-06-14 16:39:12
0 跟貼 0

湖北一高?，F場通報：94人不能畢業

極目新聞 2025-06-15 15:00:53
326 跟貼 326

富人從不說的賺錢秘訣，為你揭秘底層邏輯！

小陳同學 2025-06-11 11:32:56
1 跟貼 1

1553B總線架構，戰斗機的運算腦神經

酒苼清梔 2025-06-14 14:53:07
0 跟貼 0

全方位實測首個AI原生瀏覽器！618比價、寫高考作文

量子位 2025-06-15 12:51:58
2 跟貼 2

人民檢察史上的三個“第一份文件”

最高人民檢察院 2025-06-12 09:51:26
0 跟貼 0

美國23日起將對鋼制家電加征關稅洗衣機冰箱在列

央視新聞客戶端 2025-06-13 07:29:48
2175 跟貼 2175

豆包使用成本“卷”至1/3 火山引擎瞄準智能體“爆發” 催生智算一體機新需求

財聯社 2025-06-14 11:16:00
1 跟貼 1

女跑者真實經歷分享：天熱跑步謹慎走光，小心“春光乍泄”
馬拉松跑步健身
2025-05-29 13:53:35

14年前，那個倒貼3套房，嫁到河南農村的港姐郭羨妮，如今怎樣了
每日一見
2025-06-15 12:15:15

周末A股突發5大重要消息！不管你現在是幾成倉，接下來請聽我一句
風風順
2025-06-15 15:13:08

女優柏木文香已婚護理師，不想變老選擇出道拍片
葫蘆哥愛吐槽
2025-06-15 17:31:59

國內頂級洞潛員金雪峰，遺體水下238米處找到，事故原因曝光
出彩情感頻道
2025-06-15 16:13:21

事實證明，蔣雯麗的墮落，是整個演藝圈的“悲哀”和損失
陳穟侃故事
2025-06-06 16:35:53

利潤不足1%，孔輝科技發文叫苦，車圈恒大離爆雷又近了一步
知嘹汽車
2025-06-15 17:27:23

“大尺度”女星的瓜！
文刀萬
2025-05-23 06:05:02

伊朗搬出家底，2000枚導彈正搬上發射架？以色列領導層經不起炸
陳意小可愛
2025-06-15 19:31:56

三年6千萬-7500萬？庫明加一天練10小時成空？美媒仍盼勇士交易他
顏小白的籃球夢
2025-06-15 20:25:45

前田浩二：1-2的比分是無法接受的，對方很難打穿我們的防守
懂球帝
2025-06-15 00:34:43

在最后關頭談判破裂，中方拒絕簽字，馬克龍別無選擇
趣味萌寵的日常
2025-05-19 03:12:39

情感說心事
2025-06-15 18:38:51

難以置信！美國法官裁定：投票選舉驗證身份違憲
大洛杉磯LA
2025-06-15 02:23:52

多爾特和女友近照，落選秀逆襲，拿8750萬肥約，女友很漂亮
大西體育
2025-06-15 15:06:26

69歲老太被兒媳送養老院,偷賣掉留兒子的9套大平層,3月后兒媳懵了
風起青萍之未
2025-06-09 18:08:37

韓系開始降維攻擊！全球車型SUV跌至10萬，200Ps，比CRV更漂亮
家居智能社
2025-06-15 15:44:09

扁擔女孩拒絕注冊賬號后，我才意識到:比窮更可怕的是窮人思維
振華觀史
2025-06-15 18:15:45

石破茂譴責以色列！
環球時報國際
2025-06-13 23:59:38

外媒：德國外長稱，德法英三國向伊朗提議立即就其核計劃舉行談判
環球網資訊
2025-06-15 15:53:44

2025-06-15 21:12:49

AI先鋒官

AIGC大模型及應用精選與評測

295文章數 18關注度

往期回顧全部

科技要聞

華為Pura80系列首銷：不再嚴重缺貨

陶哲軒3小時對話流出：AI搶攻菲爾茲獎倒計時

當大模型接入玩具 AI硬件與情緒消費殊途同歸？

一輛新車比特斯拉FSD都便宜，全行業陪葬？

鴻蒙智行最便宜新車來了！尚界首款車或15萬起

頭條要聞

牛彈琴：伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

專家：遭受以方嚴重打擊后伊朗很可能出現"立場倒退"

山東壽光一生物企業發生中毒事故致7死 26人被問責

退伍軍人當全職爸爸9年:曾深夜2點逃離家不想搭理妻子

外媒：以色列想推翻伊朗政權希望看到伊朗民眾"起義"

頭條要聞

牛彈琴：伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

專家：遭受以方嚴重打擊后伊朗很可能出現"立場倒退"

山東壽光一生物企業發生中毒事故致7死 26人被問責

退伍軍人當全職爸爸9年:曾深夜2點逃離家不想搭理妻子

外媒：以色列想推翻伊朗政權希望看到伊朗民眾"起義"

體育要聞

裁判可以噴，但也從步行者自身找找問題？

排名仍升第4創新高！鄭欽文1-2不敵阿尼西莫娃，無緣倫敦站決賽

1-2！鄭欽文輸球內情曝光，賽后眼眶含淚，對手采訪說到了關鍵

首勝鄭欽文！23歲美國猛女激動躺地似奪冠已5次掀翻TOP5不容小覷

無緣決賽，鄭欽文倫敦站收獲195分，獎金78425美元

娛樂要聞

朱丹重男輕女惹爭議！讓弟弟吃雞腿惹怒網友

鳳凰傳奇禍起“手表”，“小聰明”救不了曾毅

小S過47歲生日，被指悄悄登錄內地賬號觀察輿情

趙麗穎沒參加醬園弄首映禮！怕搶了章子怡風頭？

隨便一個網紅都能敢說當林志玲老公？太荒謬

財經要聞

以伊沖突持續升級，對全球市場影響多大

茅臺價格跳水！河南市場最低1970

車企承諾60天賬期供應鏈企業迎重大利好？

知名公司退市背后美女大佬曾錯失泡泡瑪特

東阿阿膠榮膺ESG創新領軍企業以高質量發展踐行中醫藥傳承創新

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

第1批價格戰搶的雪鐵龍C6，如今還值多少錢？

座艙全面換新/設計更動感全新長安UNI-V官圖發布

標配倍適登EDC減震器嵐圖FREE+底盤信息曝光

實測百公里饋電油耗低至2.49L 吉利發布雷神AI電混2.0

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

本地

家居

旅游

呼吸科專家破解呼吸道九大謠言！

考前家長要適度“留白”！這樣做才正確

6款中醫食療方，對癥調理偏頭痛

大腦罷工？高考沖刺期5類風險食物少吃

警惕視力小偷，多多目浴陽光！

教育要聞

目前最卷孩子的可能就是體制內的成員了！

聚焦新課標指引下基于寫作學理的寫作課程與教學新實踐！這場課改中國行活動，值得關注！

醫學之路：荊棘與榮光并存，給未來醫者家長的肺腑之言

專訪華應龍 | “國數課”：用數學講好中國故事

高考出分后有6個任務，每一件都真的非常關鍵

本地新聞

最近的打工人，都在熬夜看這劇逐幀學習職場小技巧

請問江蘇的省會是哪里？還在踢，等結果

非遺里的河南 | 黃河泥變身千年墨寶，寫字都帶仙氣兒～

《中國匠人——錦繡中國》即日上線：解讀千年絲線的東方美學密碼

家居要聞

森林幾何極簡灰調原木風

精致奢華豐富的連貫空間

木質灰調現代輕奢質感

高級質感灰調木紋布藝

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

北京推薦春日10大賞花勝景地

清明假期，蘇州機關企事業單位停車場免費開放

清明流行“下江南”，揚州民宿訂單同比上漲4倍

手機 / 數碼

房產 / 家居

Llama 4多模態大模型上線即開源，測試成績、開源模式廣遭質疑

華為Pura80系列首銷：不再嚴重缺貨

牛彈琴：伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

牛彈琴：伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

裁判可以噴，但也從步行者自身找找問題？

朱丹重男輕女惹爭議！讓弟弟吃雞腿惹怒網友

以伊沖突持續升級，對全球市場影響多大

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

呼吸科專家破解呼吸道九大謠言！

目前最卷孩子的可能就是體制內的成員了！

最近的打工人，都在熬夜看這劇逐幀學習職場小技巧

森林幾何 極簡灰調原木風

熱聞|清明假期將至，熱門目的地有哪些?

Llama 4多模態大模型上線即開源，測試成績、開源模式廣遭質疑

裁判可以噴，但也從步行者自身找找問題？

朱丹重男輕女惹爭議！讓弟弟吃雞腿惹怒網友

以伊沖突持續升級，對全球市場影響多大

呼吸科專家破解呼吸道九大謠言！

目前最卷孩子的可能就是體制內的成員了！

森林幾何極簡灰調原木風