99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Manus都點贊的Claude 4,究竟好在哪兒?

0
分享至



目睹完今天 Claude 4 的發布會全程,我只看到了一句話 ——大模型正在范式轉變, AI智能體時代真的來了。



AI 編程的唯一真神 Claude 3.7 Sonnet,終于被 Antrhopic 的下一代 AI 大模型——Claude Opus 4 和 Claude Sonnet 4 徹底淘汰掉了。各國網友對此有非常直觀的感受,比如有人在一手實測中瘋狂夸贊 Claude 4:「它一下子就能寫出 8000 行代碼」。



除了 Claude 4 的推出之外,他們還順手給了幾個新智能體時代的功能拓展。

我們先從大模型講起。

01

Claude 4 瞄準了 AI 智能體編程

這次,他們推出的 Claude Opus 4 和 Claude Sonnet 4 這兩款模型都是混合模型:及時響應與深度思考并重。

可見,混合思考架構已然成為未來大模型的趨勢,用戶需要在簡單的需求下獲得更快的回復,在復雜要求中獲得更好的生成結果。兩款模型在性能、功能和應用場景上有了顯著提升,價格卻與之前的 Opus 和 Sonnet 模型保持一致,內部優化做得很好。

先從評分開始看起。Claude 4 模型在用于評估真實軟件工程任務性能的 SWE-bench Verified 基準上堪稱「遙遙領先」。值得一提的是,在本次評分對比中,Claude 4 特意被拉來與 OpenAI 前幾天剛剛高調發布的「最強 AI 編程智能體 Codex-1」進行正面較量。



Claude Opus 4 在編碼、研究、寫作和科學發現等人類復雜性高的任務方向,拓展了邊界。比如,在編碼領域它被 Cursor 稱為頂尖技術,顯著提升復雜代碼庫的理解能力,適合處理復雜的編程任務。Cognition則強調Opus 4已經能夠解決其他模型無法應對的復雜任務。

Claude Sonnet 4 將“天賦”融入日常使用場景,這款均衡型模型在內部和外部應用中兼顧了性能與效率,雖在多數領域不及 Opus 4,但提供了能力與實用性的最佳結合。它非常適合需要自主性的場景。iGent 的報告指出,Sonnet 4 在自主開發多功能應用方面表現驚艷,錯誤率幾從 20% 驟降至幾乎為零。

在下面這張綜合基準測試評分表中,Claude 4 與其他市場主流大模型在編程、推理、多模態能力、智能體任務方面都拉開了一定差距。



有趣的一點是,Anthropic 將最左側的數個基準測試名稱中都加入了「Agentic」。

2025 是 AI 智能體時代這一說法,再次被確認。

在 Anthropic 的官方發布中,有很大的篇幅著重介紹了 Claude 4 系列在「復雜項目」構建中的震撼級能力。其中,官方著重引用了 Github Copilot、iGent,甚至是 Manus 等平臺的反饋。日本一家名叫樂天得企業,甚至讓Claude Opus 4獨立編程7h,團隊自己都有些驚訝。

前段時間剛一問世就被網絡平臺譽為「上帝之手」的 Manus 則在報告中大贊 Claude Sonnet 4,稱它復雜指令遵循能力和輸出的美觀度非常高。



可以預見的是,目前智能體賽道的各個選手將會第一時間集成 Claude 4,因為它相對于之前的 Claude 模型在智能體任務中有了太多的改進。

比如:

1. Opus 4 和 Sonnet 4 不再像 Sonnet 3.7 那樣愛走捷徑和漏洞了,這種不正常的行為發生率直接降低了 65%。

2. Opus 4 也迅速跟進了「記憶增強」,現在它可以更好地執行長期任務了。

3. 使用小型模型壓縮冗長的思考過程,自己去做思考摘要。



圖注:Claude Opus 4 在玩《寶可夢時》自主記錄筆記。

02

Claude 4 其實是 LLM + Agent 的混合體?

除了 Claude 4 發布之外,整場發布會的另一個側重點是:Claude 代碼已經發布。用戶已經能夠通過終端、IDE (VS Code 和 JetBrains)及通過 Claude 代碼 SDK 后臺將 Claude 融入開發流程。用戶可以在終端中直接利用 Claude,瞬間搜索百萬行代碼庫。



在官方介紹中,Claude Code搭載 Claude Opus 4,可以通過智能體搜索全面理解代碼庫,無需手動選擇上下文即可協調多個文件更改,無縫融入工作流,直接運行于終端。



只需在 IDE 終端運行 Claude 代碼即可安裝,可擴展的 Claude 代碼 SDK 還能讓用戶輕松「打造自定義智能體和應用」。Anthropic 給想要構建智能體的用戶們又打上了一劑強心針。



Anthropic 還發布了幾個面向智能體的新功能:代碼執行工具、MCP 連接器、文件 API,以及最多可緩存一小時提示詞的能力,讓 Claude 4 幾乎成為了智能體專精模型。在我看來,這就是 Anthropic 在 AI 下半程「智能體入口爭奪戰」中的大動作。允許模型將推理與外部資源結合的設計,使 Claude 4 架構更像是一個 LLM+Agent 的混合體。

可以這么說,整場發布會看下來,Claude 4 幾乎是將自己確立為「AI 智能體時代」最能用也是最好用的大模型。

除了技術側內容,Anthropic 在安全上的操作一直都非常令人「印象深刻」,封號封的各個社區怨聲載道。官方這回依舊強調了這些模型都經過了廣泛的測試和評估,比如他們用了ASL-3 安全分類,在這個風險標準下:「AI 系統具有顯著增加災難性濫用風險」。

他們還是沿襲了Anthropic的標志性安全策略——“憲法AI”(Constitutional AI)。該方法為模型嵌入了一套“憲法”原則,通過額外的AI模型對用戶的輸入和模型的輸出進行再度掃描,檢查是否有「壞」的內容,決定是否放行。這回,Anthropic放出來的模型卡PDF中足足有123頁,其中大部分仍然是在專注于AI安全的測試。



比如,Anthropic決定根據 AI 安全級別 3 標準發布 Claude Opus 4,根據 AI 安全級別 2 標準發布 Claude Sonnet 4,分級分的非常精準。

但是,現在的外網針對 Claude 4「過于高」的安全措施的討論,幾乎亂成了一鍋粥。因為有網友似乎基于Claude給出的系統卡文件爆料:Claude 4 會檢測用戶內容,并自主「報警」……



雖然暫無法確定這些爆料是否真實,但也確實反映了大家認為 Claude 4 的安全措施真的太過于嚴格了,甚至到了可能影響用戶體驗或功能性的地步。畢竟,國內的Claude使用者已經流行起了「打一槍,換一個地」的使用策略。

03

Claude 4 在實測中全面提升

目前各個社區、各個國家的網友全部在瘋狂測試這款即將取代 Claude 3.7 Sonnet 的大模型。為了支撐智能體中常常需要的長序列復雜處理任務,具有美感輸出能力且超強的 AI 編程能力的大模型仍然是極度稀缺的。Claude 4 系列只是看前方無人在,順勢補缺而已。

那么說到底,Claude 4 面對復雜性任務,表現到底有多超綱?

下面來看看全網實測案例:

Claude 4 與 Blender MCP 的連接,讓產品 3D 模型設計幾乎有了質的飛躍。像是有網友使用 Claude 4 和 Blender 通過 MCP 聯動制作了日本清水寺的 3D 模型。這回的 Claude 4 相比于前代 Claude 3.7,編程時間大幅減少,全程無需「人類陪伴」,AI 的幻覺發生率也下降了很多。



甚至還有網友使用 Claude Opus 4 制作了類似 Bemani 2DX 風格的游戲。不僅重現了經典的音樂游戲體驗,還融入了許多創新元素,提升了游戲的可玩性和趣味性。

Claude 4 在面對復雜任務的處理上十分得心應手。比如有網友輸入提示詞:用立體相機拍攝物體,推測 3D 空間坐標,并通過交互式可視化展示,并支持拖動。

除了硬核編程能力的提升之外,Claude 4 在設計感上正如 Manus 所說,有了很大的美學提升。很多網友曾在各個社區評論下笑稱:各個智能體什么小游戲都能做,但是沒見過做 PPT 的。

一位外網網友就試著讓 Claude 4 制作說明幻燈片,呈現出來的效果非常具有設計感,整體要素也更加簡潔。

在美學的提升方面,這有個更直觀的 Case。一位網友只給了 Claude Opus 4 一小段提示詞:“將書籍 《Piranesi》作為 p5js 3d 空間,do it for me”,沒有摻雜任何其他元素。

Claude Opus 4 甚至在初版原型中加入鳥、光照、水面等元素,雖然效果還比較基礎,但仍能反應這款旗艦模型的性能。

目前,大量的 AI 編程平臺(像是 Cursor、Trae、WindsurfVapi、Codegen)、智能體產品(像是 Flowith)內幾乎都迅速接入了 Claude 4 系列,畢竟它可能是能進一步提升智能體表現的重要模型。



Anthropic 由于一直以來專注于安全頂層設計,而常常被認為「他們還沒有找到一個合適的 AI 入口,只能當個掃地神僧,甚至沒有辦法參加到最高級別的公開賽場之中」。

當 Claude 4 系列模型發布,以及其他像是代碼執行器、MCP 連接器、Claude 代碼等等面向智能體產品的功能模塊推出,Anthropic 可以說已經拿到了一個非常好的「智能體入口」,正式站到了頂級賽場。

從 Anthropic 去年推出 MCP 協議以來,再到 Claude 4 的出現,他們已經在事實上為 AI 智能體時代按下了「加速鍵」。Anthropic 的 CEO——Dario Amodei 為整個 AI 大模型賽道明確了一個未來的方向:真正優秀的 AI 大模型,一定是「大模型」與「智能體」的深度融合 —— 它能編程、能思考,還能自主解決復雜問題,甚至具備了美學與設計感。

AI 的下半場早已經開啟,Claude 4 正在引領一場新的「 AI 大模型+智能體」范式轉變。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
4:0!南通隊拿下“蘇中德比”,積分榜第1!網友:“南哥”學習好,踢球也棒!

4:0!南通隊拿下“蘇中德比”,積分榜第1!網友:“南哥”學習好,踢球也棒!

揚子晚報
2025-06-01 20:13:48
王曉晨六一再秀恩愛,曬俞灝明送的愛心玫瑰花束,婚后儀式感依舊

王曉晨六一再秀恩愛,曬俞灝明送的愛心玫瑰花束,婚后儀式感依舊

馬哅戶外釣魚哥
2025-06-01 11:23:40
福建區劃調整傳聞:三明南平合并、莆田歸屬成焦點

福建區劃調整傳聞:三明南平合并、莆田歸屬成焦點

魚見小美好
2025-06-01 09:30:16
熱鬧的香會2025:中國防長缺席,美防長老調重彈,法總統胡言亂語

熱鬧的香會2025:中國防長缺席,美防長老調重彈,法總統胡言亂語

阿紿聊社會
2025-06-01 21:17:10
亞歷山大季后賽得分301分91板156助,哈利伯頓為多少?

亞歷山大季后賽得分301分91板156助,哈利伯頓為多少?

許礆很機智
2025-06-01 23:03:20
李夢集訓瘦了很多!身材凹凸有致!妝容淡了最重要的是心態也變了

李夢集訓瘦了很多!身材凹凸有致!妝容淡了最重要的是心態也變了

老吳說體育
2025-05-30 08:35:51
打臉真快!《碟中諜8》票房將近2億,豆瓣7.7分,網友心里明白!

打臉真快!《碟中諜8》票房將近2億,豆瓣7.7分,網友心里明白!

玫瑰講娛
2025-06-01 19:01:57
迪士尼疑因游客拍照順序起沖突,扭打時幼兒被推搡,媽媽崩潰大哭

迪士尼疑因游客拍照順序起沖突,扭打時幼兒被推搡,媽媽崩潰大哭

奇思妙想草葉君
2025-06-01 23:49:27
U16國足5-2澳大利亞U16,名宿范志毅賽后點評,句句都是實在話!

U16國足5-2澳大利亞U16,名宿范志毅賽后點評,句句都是實在話!

田先生籃球
2025-06-01 22:18:19
南昌大悅城沸騰啟幕:首日客流量破24萬人次,銷售額達1630萬元,引爆全城打卡熱潮!

南昌大悅城沸騰啟幕:首日客流量破24萬人次,銷售額達1630萬元,引爆全城打卡熱潮!

南昌樓市情報
2025-06-01 16:41:44
比亞迪公關部總經理李云飛回應“汽車圈恒大”:總負債5800多億很危險!那豐田2.7萬億、大眾3.4萬億、上汽6104億,他們危險嗎

比亞迪公關部總經理李云飛回應“汽車圈恒大”:總負債5800多億很危險!那豐田2.7萬億、大眾3.4萬億、上汽6104億,他們危險嗎

和訊網
2025-05-30 15:35:33
“突然消失”的5種大家電:曾經紅極一時,現在“白送”都沒人要

“突然消失”的5種大家電:曾經紅極一時,現在“白送”都沒人要

裝修秀
2025-04-12 11:40:03
俄羅斯發起“斬首”行動,不到48小時,普京迎來3個噩耗

俄羅斯發起“斬首”行動,不到48小時,普京迎來3個噩耗

荷蘭豆愛健康
2025-06-01 12:23:20
善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

卷史
2025-05-02 13:38:20
U16國青5:2戰勝袋鼠奪得四國賽冠軍,浮嶋敏配得上更多信任

U16國青5:2戰勝袋鼠奪得四國賽冠軍,浮嶋敏配得上更多信任

李廣專業體育評論
2025-06-01 21:33:08
上海迪士尼游客撕打:女孩被打頭,全程情緒穩定,母親卻蹲地痛哭

上海迪士尼游客撕打:女孩被打頭,全程情緒穩定,母親卻蹲地痛哭

來條娛吃
2025-06-01 21:53:39
1-2被逆轉!鄭欽文大贏家,四大競爭對手全部出局,無人進法網8強

1-2被逆轉!鄭欽文大贏家,四大競爭對手全部出局,無人進法網8強

侃球熊弟
2025-06-01 22:39:03
莫言:如果你混到沒人找你吃飯,連電話也沒幾個,你不是人緣變差

莫言:如果你混到沒人找你吃飯,連電話也沒幾個,你不是人緣變差

詩詞中國
2025-05-11 15:12:34
尼克斯遭淘汰!賽后紐約球迷圍毆、踩踏特雷·楊玩偶進行進行情緒發泄

尼克斯遭淘汰!賽后紐約球迷圍毆、踩踏特雷·楊玩偶進行進行情緒發泄

雷速體育
2025-06-01 14:59:21
還沒開始就要結束?更年輕的亞馬爾、杜埃勢頭比哈蘭德、姆巴佩猛

還沒開始就要結束?更年輕的亞馬爾、杜埃勢頭比哈蘭德、姆巴佩猛

體育世界
2025-06-01 14:42:08
2025-06-02 00:20:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
1883文章數 7995關注度
往期回顧 全部

科技要聞

熱搜!雷軍疑回應余承東

頭條要聞

高密化工廠爆炸 當地自媒體發倡議:該廠是高密人的驕傲

頭條要聞

高密化工廠爆炸 當地自媒體發倡議:該廠是高密人的驕傲

體育要聞

一邊倒的歐冠決賽,青春無敵的新科冠軍

娛樂要聞

等等小花給鄧超拍雜志 插畫由小花繪制

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

旅游
家居
健康
本地
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

原木純白 邂逅自然本真

唇皰疹和口腔潰瘍是"同伙"嗎?

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 信阳市| 云南省| 南充市| 囊谦县| 五常市| 平南县| 株洲县| 奉化市| 利川市| 米脂县| 临城县| 抚顺县| 新绛县| 桑植县| 霍山县| 枣强县| 闽侯县| 长泰县| 大埔县| 西充县| 怀宁县| 岳阳县| 胶州市| 漳州市| 瑞安市| 新乐市| 沙田区| 深水埗区| 隆化县| 青龙| 广南县| 宁远县| 三都| 凤台县| 呼和浩特市| 无棣县| 海城市| 太仆寺旗| 界首市| 二连浩特市| 梁平县|