99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Llama 4多模態大模型上線即開源,測試成績、開源模式廣遭質疑

0
分享至

作者|沐風

來源|AI先鋒官

就在這周末,開源界元老Meta正式推出了首個原生多模態Llama 4系列模型,性能上全面超越GPT-4o、Gemini 2.0等頂級競品,同時支持1000萬token超長上下文。

該系列總共公布了3個模型,分別為Scout、Maverick和Behemoth。


在這三個模型中,Maverick、Scout都是從Behemoth上蒸餾得來,并且Scout和Maverick已經開源,可以在其官網和Hugging Face上進行下載。

據官方介紹,Llama 4是Meta迄今為止最先進的模型,也是同類產品中多模態性最強的模型。

另外,Llama 4模型是Llama系列模型中首批采用混合專家(MoE)架構的模型,也是DeepSeek系列模型采用的架構。

與傳統的稠密模型相比,在MoE架構中,單獨的token只會激活全部參數中的一小部分,訓練和推理的計算效率更高。

接下來,我們就一起看看Llama 4系列模型都有哪些亮點。

Llama 4 Scout

  • 擁有170億活躍參數,總參數量為1090億。

  • 配備了16個專家模塊,每次推理激活其中2個。

  • 支持1000萬token上下文。

  • 單張H100 GPU即可運行。

  • 在基準測試中,其性能表現超過了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。


Llama 4 Maverick

  • 同樣具備170億活躍參數,總參數量增加至4000億。

  • 專家模塊的數量增加到128個,每次推理激活17個專家。

  • 支持1000萬token上下文。

  • 基準測試中,其性能表現超越了GPT-4o和Gemini 2.0 Flash。

  • 在推理、編程、多語言等任務上媲美DeepSeek v3,但參數僅為其一半。

  • 在LMArena測試中,ELO評分高達1417。


Llama 4 Behemoth

  • 擁有2880億個活躍參數,總參數量接近2萬億。

  • 具體有16個專家模型。

  • 在多個 STEM 基準測試中優于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。

  • 目前仍在訓練中,尚未公開發布。


值得一提的是,Llama 4 Maverick一經發布就沖上了LMArena排行榜中的第二名,僅僅比 Gemini-2.5-pro模型少22分,成為第四個突破 1400 分的大模型。


但這一成績卻引發了諸多質疑。

據多位AI研究人員在社交平臺X上指出,Meta在LMArena上部署的Llama 4 Maverick與廣泛提供給開發者的版本并不一致。



不過,Meta在其公告中明確提到,參與LMArena測試的Llama 4 Maverick是一個“實驗性聊天版本”。

而根據官方Llama網站上公布的信息,Meta 在LMArena的測試中所使用的實際上是“針對對話性優化的Llama 4 Maverick”。這表明,該版本經過了專門的優化調整,以適應 LM Arena 的測試環境和評分標準。


有AI研究人員在社交平臺X上指出,公開可下載的Maverick與LMArena上托管版本之間存在明顯行為差異。LMArena版本更傾向于使用大量表情符號并提供冗長的回答,這在標準版本中并不常見。


在實際使用中,很多人覺得Llama 4的編碼能力和數學邏輯方面都沒有測試中那么厲害,甚至有社區用戶給它進行了重新打分,重新打分后的Llama 4連前10都進不去。


在經典測試題“strawberry中有多少個R”的問題上,Llama 4 Maverick也未能做對。


據博主“karminski-牙醫”發布的評測結果顯示,Llama 4 Maverick與Qwen-QwQ-32B的寫代碼水平一致,Scout則是直接掛科。

其更是直言:“不建議用Llama 4寫代碼”。



看來,Llama 4這次更像是個“偏科生”,多模態和長文本是長板,但邏輯推理和代碼生成似乎還需要打磨。

除此之外,Llama 4的開源模式也遭質疑。

例如,油管知名博主1littlecoder就指出Llama 4的許可條款與真正的開源精神相去甚遠。

馬克·扎克伯格在Llama 4發布視頻中充滿熱情地宣布:"今天是Llama 4的日子。我們的目標是構建世界領先的AI,將其開源,并使其普遍可訪問,讓全世界都能受益。我一直認為開源AI將成為領先模型,而隨著Llama 4,這開始變為現實。"

然而,1littlecoder直言不諱地表示:"這是對開源的污蔑,與開源毫無關系。你可以稱它為開放模型,你可以稱它為開放權重模型,但它不是開源的。"

1littlecoder認為,開源軟件的基本原則之一是普遍可訪問性。開源通過開源或免費許可促進對產品的普遍訪問。這意味著任何人都應該能夠訪問你的產品,而不會有太多麻煩。"

與其他真正開源的AI模型相比,Llama 4的獲取過程顯得異常復雜。

1littlecoder提到,“Meta的模型要求你首先登錄Hugging Face賬戶,這點我能理解,他們可能有垃圾郵件問題。然后填寫表格,務必提供你的法定全名。我是說,為什么下載PyTorch權重或一些隨機二進制文件需要提供我的法定姓名?還有出生日期、完整的組織名稱、所有公司標識符?!?/p>


更令人擔憂的是,表格上明確警告:“避免使用首字母縮寫和特殊字符。未能按照這些指示操作可能會阻止你訪問此模型和Hugging Face上的其他模型。提交后,你將無法編輯此表格。因此,請確保所有信息準確無誤?!?/strong>

這意味著一旦因填寫信息不當被Meta禁止,用戶可能永遠無法從Hugging Face下載該模型,這與開源軟件的普遍可訪問性原則直接沖突。

更具爭議性的是Llama 4的社區許可協議。

1littlecoder更是將其描述為"對開源的污蔑"。

這份許可協議包含多項限制,直接挑戰了傳統開源定義:

首先是用戶限制條款:“如果你擁有一家月活躍用戶超過7億的公司,你不能使用這個模型。”雖然這對大多數開發者來說影響有限,但它違背了開源軟件不應對使用者有歧視的基本原則。

其次是關于再分發的嚴格要求。許可證規定,如果分發或提供Llama材料,必須顯示"使用Llama構建"的標志。

1littlecoder對此表示強烈不滿:“為什么我要這樣做?你想加速開源,對吧?你不是在尋求任何好處,因為你相信開源。只要給我模型,我想怎么用就怎么用。這是愚蠢,完全的愚蠢?!?/p>

更令人震驚的是命名要求:“如果你使用Llama材料或任何Llama材料的輸出或結果來創建、訓練、微調或以其他方式改進分發或提供的AI模型,你還應該在任何此類AI模型名稱的開頭包含‘Llama’?!?/p>

此外,還有版權聲明要求:“在你分發的Llama材料的所有副本中,你必須包含以下歸屬聲明,并與分發的此類副本一起提供聲明文本文件‘Llama 4的許可證和Llama 4社區許可證,版權Meta平臺,保留所有權利?!?/p>

1littlecoder在結束時呼吁AI社區重新思考什么才是真正的開源:“請不要稱這為開源。我相信,將任何進入Hugging Face的愚蠢模型稱為開源,對于開源代表的內容或開源支持者來說,是一種污蔑。這不是開源,只是你可以下載并帶有一堆限制的開放權重?!?/p>

掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

往期文章回顧

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

馬拉松跑步健身
2025-05-29 13:53:35
14年前,那個倒貼3套房,嫁到河南農村的港姐郭羨妮,如今怎樣了

14年前,那個倒貼3套房,嫁到河南農村的港姐郭羨妮,如今怎樣了

每日一見
2025-06-15 12:15:15
周末A股突發5大重要消息!不管你現在是幾成倉,接下來請聽我一句

周末A股突發5大重要消息!不管你現在是幾成倉,接下來請聽我一句

風風順
2025-06-15 15:13:08
女優柏木文香已婚護理師,不想變老選擇出道拍片

女優柏木文香已婚護理師,不想變老選擇出道拍片

葫蘆哥愛吐槽
2025-06-15 17:31:59
國內頂級洞潛員金雪峰,遺體水下238米處找到,事故原因曝光

國內頂級洞潛員金雪峰,遺體水下238米處找到,事故原因曝光

出彩情感頻道
2025-06-15 16:13:21
事實證明,蔣雯麗的墮落,是整個演藝圈的“悲哀”和損失

事實證明,蔣雯麗的墮落,是整個演藝圈的“悲哀”和損失

陳穟侃故事
2025-06-06 16:35:53
利潤不足1%,孔輝科技發文叫苦,車圈恒大離爆雷又近了一步

利潤不足1%,孔輝科技發文叫苦,車圈恒大離爆雷又近了一步

知嘹汽車
2025-06-15 17:27:23
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
伊朗搬出家底,2000枚導彈正搬上發射架?以色列領導層經不起炸

伊朗搬出家底,2000枚導彈正搬上發射架?以色列領導層經不起炸

陳意小可愛
2025-06-15 19:31:56
三年6千萬-7500萬?庫明加一天練10小時成空?美媒仍盼勇士交易他

三年6千萬-7500萬?庫明加一天練10小時成空?美媒仍盼勇士交易他

顏小白的籃球夢
2025-06-15 20:25:45
前田浩二:1-2的比分是無法接受的,對方很難打穿我們的防守

前田浩二:1-2的比分是無法接受的,對方很難打穿我們的防守

懂球帝
2025-06-15 00:34:43
在最后關頭談判破裂,中方拒絕簽字,馬克龍別無選擇

在最后關頭談判破裂,中方拒絕簽字,馬克龍別無選擇

趣味萌寵的日常
2025-05-19 03:12:39
人活著,一切皆是天意!(不信你看)

情感說心事
2025-06-15 18:38:51

難以置信!美國法官裁定:投票選舉驗證身份違憲

難以置信!美國法官裁定:投票選舉驗證身份違憲

大洛杉磯LA
2025-06-15 02:23:52
多爾特和女友近照,落選秀逆襲,拿8750萬肥約,女友很漂亮

多爾特和女友近照,落選秀逆襲,拿8750萬肥約,女友很漂亮

大西體育
2025-06-15 15:06:26
69歲老太被兒媳送養老院,偷賣掉留兒子的9套大平層,3月后兒媳懵了

69歲老太被兒媳送養老院,偷賣掉留兒子的9套大平層,3月后兒媳懵了

風起青萍之未
2025-06-09 18:08:37
韓系開始降維攻擊!全球車型SUV跌至10萬,200Ps,比CRV更漂亮

韓系開始降維攻擊!全球車型SUV跌至10萬,200Ps,比CRV更漂亮

家居智能社
2025-06-15 15:44:09
扁擔女孩拒絕注冊賬號后,我才意識到:比窮更可怕的是窮人思維

扁擔女孩拒絕注冊賬號后,我才意識到:比窮更可怕的是窮人思維

振華觀史
2025-06-15 18:15:45
石破茂譴責以色列!

石破茂譴責以色列!

環球時報國際
2025-06-13 23:59:38
外媒:德國外長稱,德法英三國向伊朗提議立即就其核計劃舉行談判

外媒:德國外長稱,德法英三國向伊朗提議立即就其核計劃舉行談判

環球網資訊
2025-06-15 15:53:44
2025-06-15 21:12:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
295文章數 18關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

牛彈琴:伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

頭條要聞

牛彈琴:伊朗遭遇了"三重背叛" 連俄羅斯都被騙了

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

朱丹重男輕女惹爭議!讓弟弟吃雞腿惹怒網友

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

健康
教育
本地
家居
旅游

呼吸科專家破解呼吸道九大謠言!

教育要聞

目前最卷孩子的可能就是體制內的成員了!

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

家居要聞

森林幾何 極簡灰調原木風

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 岑巩县| 庆安县| 五指山市| 万年县| 霍邱县| 富平县| 宁武县| 通山县| 台南市| 日照市| 金昌市| 台中县| 科技| 秦皇岛市| 荥阳市| 登封市| 长沙县| 会泽县| 汽车| 乐都县| 佛教| 聂拉木县| 甘南县| 勃利县| 安远县| 诏安县| 芜湖市| 仪征市| 南京市| 邳州市| 花莲市| 景洪市| 永仁县| 吉水县| 秦皇岛市| 礼泉县| 都匀市| 霍邱县| 长子县| 伊宁市| 汕头市|