99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

體驗Meta的Llama 4,就也還行?

0
分享至


文:王智遠 | ID:Z201440

昨天(4月6日凌晨),Meta發布了Llama 4的消息,估計你也聽說了。要是你想了解更多,可以去這兩個網址看看:

官方介紹頁面:https://ai.meta.com/meta-ai
官網地址:https://www.meta.ai

登錄后,Chatbot的頁面特別簡單,一打開就能免費試用。左邊有個小菜單,三個選項:對話框、收藏,還有Meta畫畫。

這次Meta推出了三個不同版本的Llama 4。

第一個叫Llama 4 Scout(偵察兵),它有170億個活躍參數,就像它手上有170億個小工具可以隨時用。它還有16個專家模型幫忙,總參數量加起來有1090億。

這個版本適合做輕量級的任務,比如:總結文檔、處理代碼庫之類的推理任務。能支持1000萬字的上下文。

第二個版本叫Llama 4 Maverick,有點像“特立獨行”的意思;它同樣有170億參數,但專家模型增加到了128個,總參數量達到4000億;場景適合多模態,像文檔、圖標、PDF等。

目前我看到介紹,它在很多基礎測試里表現特別好,超過了GPT-4o和Gemini 2.0 Flash,在推理和編碼任務上和DeepSeek v3差不多厲害。

最厲害的是第三個版本,叫Llama 4 Behemoth(巨獸)。官方說,它的總參數接近2萬億,活躍參數有2880億。不過,這個版本還沒正式發布,它主要是當“老師”,用自己的知識教Scout和Maverick。

很多人可能不太明白“活躍參數”是什么。我打個比方:

一個超級大廚(模型)有很多很多工具和技巧(總參數量),但做飯的時候,他只會用到其中一部分(活躍參數)。

活躍參數越多,廚師能用的工具和技巧就越多,做出來的菜(也就是任務效果)可能就越好吃(厲害)。

面對這三個版本,說實話,我都覺得太厲害,完全無法想象它的強大。尤其是2萬億參數的版本,似乎吞掉了整個世界的知識,消化掉了人類文明的精髓。

既然這樣,問題來了:

吹的這么大,到底該如何評價它的性能呢?是遙遙領先,還是一騎絕塵?說實話,我都已經沒有概念了。

不過,我直接問Llama 4:針對一個這么大的模型,該問什么問題,才能感受到它的厲害呢?

它告訴我,可以試試多步驟推理、自然語言理解問題、創造性寫作、多語言翻譯,或者對某個領域的知識進行解析;從這些角度提問,能更好地感受到Llama 4的強大之處。

索性從多步驟推理開始。我問的第一個問題:

假設你有100元,想用這些錢買一種商品。這種商品每件3元,但商家有個優惠活動:如果你一次性買超過10件,每件可以便宜1元。那我最多能買多少件呢?請快速推理并給出答案。



它不到2秒就給出了答案。我用Kimi、DeepSeek、Qwen分別測試了這個問題,結果也都差不多。毫無疑問,這種問題對模型來說太簡單了,簡直小菜一碟。

那怎么辦呢?

我向Qwen咨詢了一個問題,我對Qwen2.5-Max說:請給我一個超難的問題,來測試Llama 4的多步驟推理,越難越好。

經過一番思考,Qwen給出了一道題目,并解釋說,這道題的關鍵在于“短小精悍”,同時要覆蓋多語言翻譯、事實核查和語義分析這三項能力。

它還提到,這道題符合知識庫中的評測維度,比如翻譯技巧和幻覺檢測。問題是這樣的:請閱讀以下句子,并完成以下任務:一,將句子翻譯成法語,保留原意; 二,指出句子中可能被夸大的部分,并解釋原因。

句子如下:

盡管人工智能在醫療、金融等領域被稱為革命性力量,但其通過節能算法緩解氣候變化的效果仍存在爭議。

結果來看,Kimi回答比Llama 4更詳細。Kimi指出兩個可能被夸大的地方:一是“革命性力量”,二是“仍存在爭議”。而Llama 4只指出了其中一個。



接下來,我體驗了一個自然語言理解的難題。Qwen說,這個問題看起來很簡單,其實里面藏著很深的難度。

它不僅要識別“相關性≠因果性”的謬誤,還要補充隱含條件,考驗邏輯重構能力。我把任務交給Llama 4:請分析下中文句子的邏輯漏洞,并用英語改寫句子,讓它更嚴謹。句子是:

"所有成功企業家都早起,因此如果你想創業成功,必須每天五點起床。"

對比Kimi和Llama 4的答案,我認為Llama 4的回答更簡潔,但Kimi的表達更詳細、更清晰。



然后,我研究了一道“領域知識”。問題是:設計一個基于AI的商品智能推薦系統的測試方案。

我讓Llama 4先分析問題,再給出答案。它說,主要存在三個測試難點。不過,它給的答案和Kimi給的答案我都不太滿意,主要問題是:

答案太宏觀、太理論化,雖然也有舉例,但都沒具體說清楚“到底該怎么做”。可能因為我之前提出的問題不夠詳細。

這也給我一個提醒:雖然網上有海量公開資料,但遇到行業知識或者具體問題時,AI在個人經驗方面還是差了點火候。



最后,我試了試創造性寫作,感覺特別有意思。

題目是寫一個微小說,里面要包含“鑰匙”“雨夜”“陌生人”這三個元素,還得分析用到的文學技巧。

Llama 4給出了好幾個版本,創造力和理解力都很強。相比之下,Kimi只寫了一個版本,感覺Llama 4在處理復雜任務時更有優勢,能給出更多元化的回答。

我覺得,以后可以用這個功能寫更多好玩的段子,確實是一件很有趣的事情。



我還試了它的文生圖能力。

隨便說了一句“幫我換輪胎”,它居然生成了四張不同的圖,每張都不一樣。其中第四張看起來像在森林里換輪胎,感覺挺真實的。

我可以點進去繼續修改,只要告訴它我的想法就行。上傳照片換背景圖,也可以。不過,修改效果不太理想,不如ChatGPT 4o。

經過這一系列體驗,所以,我得出什么結論呢?



Llama 4的文本處理能力很強。會理解上下文的意思,回答問題時,能給出很準確、很貼切的答案。特別是碰到復雜的問題,或者要仔細琢磨的任務,它表現得特別好。

比如,我讓它幫我做一個測試,根據一段文本理解人類的情感,把這種情感用到別的地方,它都能搞定。

語言生成能力也很棒,寫出來的文本很流暢、很自然。有時,它還能模仿某種特定的寫作風格或者語氣;還有一個優點,多輪對話能力很強。不管后面給它什么內容,前面的內容它都不會忘。

不過,也有不足的地方。

在一些專業知識上,還不夠深入、不夠具體。但有個好處,它能帶著我一起完成任務;我有個問題自己解決不了,交給它,它就能分步驟帶著我一起做,最后把任務完成。

在交互方面,它也很厲害。

從普通的文字聊天,到生成圖片,再到上傳文件讓它幫忙修改,這些都能在一個聊天框里搞定。甚至還能基于圖片制作動畫,功能很全面。不過,它沒有語音功能,也不能聯網搜索,這有點不太方便。

但是,雖然它能進行多種交互,但有時候也會出錯。

我給它一個PDF文件,讓它把里面的內容提取出來做成表格,結果它卻生成了一個圖標。這種理解上的偏差還挺讓人頭疼的。

可能它在開源市場更有潛力吧,感興趣,可以試試。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普確認:印巴空戰有5架戰機被擊落,我們通過交易解決了問題

特朗普確認:印巴空戰有5架戰機被擊落,我們通過交易解決了問題

不掉線電波
2025-07-19 13:36:14
獲賠88萬律師拿走55萬后續:憑本事拿的并沒錯,本人回應律協發聲

獲賠88萬律師拿走55萬后續:憑本事拿的并沒錯,本人回應律協發聲

大魚簡科
2025-07-18 21:22:34
第四簽!官方:阿森納簽下23歲切爾西邊鋒馬杜埃凱,總價5200萬鎊

第四簽!官方:阿森納簽下23歲切爾西邊鋒馬杜埃凱,總價5200萬鎊

直播吧
2025-07-19 00:13:05
演唱會偷情被6萬人抓奸!美國版"野鴛鴦"身份被扒,正宮連夜離婚

演唱會偷情被6萬人抓奸!美國版"野鴛鴦"身份被扒,正宮連夜離婚

烏娛子醬
2025-07-18 21:03:14
結盟一時爽,中俄火葬場?為何合作無上限的中俄兩國始終不結盟?

結盟一時爽,中俄火葬場?為何合作無上限的中俄兩國始終不結盟?

靜夜史君
2025-07-18 12:15:03
柬埔寨王家軍及特種部隊全面待命,洪瑪奈發令了!

柬埔寨王家軍及特種部隊全面待命,洪瑪奈發令了!

新民周刊
2025-07-19 09:07:49
ESPN專家評夏季聯賽最有前途新秀:弗拉格、哈珀、特雷·約翰遜

ESPN專家評夏季聯賽最有前途新秀:弗拉格、哈珀、特雷·約翰遜

雷速體育
2025-07-19 09:56:22
55歲滕哈赫麻了!藥廠首秀1-5恥辱,對手是一群孩子 嘴硬:不在乎

55歲滕哈赫麻了!藥廠首秀1-5恥辱,對手是一群孩子 嘴硬:不在乎

風過鄉
2025-07-19 06:02:01
毀三觀!印度發生集體猥褻事件,現場畫面曝光,女人被圍住狂蹭

毀三觀!印度發生集體猥褻事件,現場畫面曝光,女人被圍住狂蹭

烏娛子醬
2025-07-18 19:30:23
時機已到,該收拾馮德萊恩了!中國一道禁令封鎖,必須殺雞儆猴

時機已到,該收拾馮德萊恩了!中國一道禁令封鎖,必須殺雞儆猴

現代小青青慕慕
2025-07-19 08:42:29
比自來水發臭更危險的,是補償5噸水的傲慢與敷衍

比自來水發臭更危險的,是補償5噸水的傲慢與敷衍

基本常識
2025-07-18 23:31:36
41歲老板西藏自駕游去世!事業成功、有錢有閑,疑太過自信害了他

41歲老板西藏自駕游去世!事業成功、有錢有閑,疑太過自信害了他

云景侃記
2025-07-18 19:50:43
杭州自來水發臭小區居民稱收到水質檢測報告:“臭和味”項目顯示為“符合”

杭州自來水發臭小區居民稱收到水質檢測報告:“臭和味”項目顯示為“符合”

紅星新聞
2025-07-18 20:51:18
美國游客因佩戴金項鏈,在意大利米蘭遭割喉搶劫,滿臉是血:我不想死

美國游客因佩戴金項鏈,在意大利米蘭遭割喉搶劫,滿臉是血:我不想死

魯中晨報
2025-07-18 15:44:13
師徒反目15年后,曹云金用一場漂亮的翻身仗,讓郭德綱高攀不起

師徒反目15年后,曹云金用一場漂亮的翻身仗,讓郭德綱高攀不起

禾寒敘
2025-07-18 22:42:15
71歲陳佩斯深夜痛哭!執導電影被聯合絞殺,被迫延期,官媒力挺

71歲陳佩斯深夜痛哭!執導電影被聯合絞殺,被迫延期,官媒力挺

銀河史記
2025-07-18 13:09:30
郎咸平評宗家遺產爭奪:杜建英水平太臭,三子女可能不是宗慶后的

郎咸平評宗家遺產爭奪:杜建英水平太臭,三子女可能不是宗慶后的

南宗歷史
2025-07-19 00:05:23
比“啤酒肚”更可怕的是“中國式大爺發型”!油膩又老土,是你嗎

比“啤酒肚”更可怕的是“中國式大爺發型”!油膩又老土,是你嗎

時尚搭配師Nicole
2025-07-18 21:23:00
遼寧暴走團牽頭人:不讓道沒錯!堵10米寬路有前科 各方回應打太極

遼寧暴走團牽頭人:不讓道沒錯!堵10米寬路有前科 各方回應打太極

探源歷史
2025-07-18 22:16:11
劉慧任上被查!今年已有6名正部級官員落馬

劉慧任上被查!今年已有6名正部級官員落馬

魯中晨報
2025-07-18 15:16:10
2025-07-19 15:00:49
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
477文章數 90關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

男子時隔5年再因"重婚"被警方調查 自稱沒辦過結婚證

頭條要聞

男子時隔5年再因"重婚"被警方調查 自稱沒辦過結婚證

體育要聞

西蒙尼最彪悍的弟子,正成為下個“匪帥”

娛樂要聞

肖戰微博改名爆!保留了三部代表作

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

親子
教育
本地
公開課
軍事航空

親子要聞

媽媽真實記錄姐妹倆學習半小時,姐姐專注力滿分

教育要聞

北京“1+3”爆火!這所學校亮出三大“秘密武器”

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:印巴沖突期間有5架戰機被擊落

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 眉山市| 洛浦县| 班玛县| 崇仁县| 玉溪市| 四平市| 信宜市| 福建省| 平遥县| 商丘市| 鹿泉市| 大庆市| 遂宁市| 离岛区| 广汉市| 南昌县| 沙坪坝区| 松原市| 岗巴县| 盐源县| 南昌县| 潼南县| 恩平市| 黄骅市| 永丰县| 漠河县| 盱眙县| 兴和县| 台湾省| 白沙| 苏尼特左旗| 荣成市| 建湖县| 宜黄县| 托克托县| 调兵山市| 博爱县| 文昌市| 梅河口市| 弥渡县| 许昌县|