機器之心報道
機器之心編輯部
復雜推理,編程能力都有飛躍,上來就會「勒索人類」。
全世界都在等待 GPT-5、DeepSeek V4,但今天起,大模型競爭已經進入了全新階段。
北京時間周五凌晨,知名 AI 創(chuàng)業(yè)公司 Anthropic 正式推出 Claude 4 系列大模型。先期推出的型號包括 Claude Opus 4 和 Claude Sonnet 4,它們?yōu)榇a生成、高級推理和 AI 智能體樹立了全新標準。
Anthropic 表示,Claude Opus 4 是一款全球領先的編碼模型,它在復雜、長時間運行任務和智能體工作流中擁有持續(xù)的高性能。Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升級,提供卓越的代碼和推理能力,同時更精確地響應用戶指令。
在 Demo 視頻中,Anthropic 展示了 Claude 4 如何無縫融入人們整個工作日。它擁有三大高級功能:通過 Claude 應用中自定義集成進行深入研究,管理項目,并能在 Claude Code 中獨立解決代碼任務。
除新模型之外,Anthropic 還宣布了一系列新能力:
- 使用工具進行擴展思考(Beta 版):兩種新模型都可以在擴展思考過程中使用工具(如網(wǎng)絡搜索),允許 Claude 在推理和工具使用之間交替選擇,以提升模型輸出效果。
- 新的模型能力:兩種模型都可以并行使用工具,更精確地遵循指令。當開發(fā)人員授予其訪問本地文件的權限時,它們會大幅提升記憶能力,提取和保存關鍵信息以保持連續(xù)性,并隨著時間的推移構建隱性知識。
- 正式發(fā)布 Claude Code:Anthropic 擴展了開發(fā)人員與 Claude 的協(xié)作方式。Claude Code 現(xiàn)在支持通過 GitHub Actions 執(zhí)行后臺任務,并與 VS Code 和 JetBrains 原生集成,可直接在文件中顯示編輯內容,從而實現(xiàn)無縫的結對編程。
- 新的 API 功能:Anthropic API 將發(fā)布四項新功能,讓開發(fā)人員能夠構建更強大的 AI 智能體:代碼執(zhí)行工具、MCP 連接器、Files API 以及 Prompt 緩存長達一小時的新功能。
Claude Opus 4 和 Sonnet 4 是混合模型,均提供兩種模式:快速響應和用于更深層次推理的擴展思維模式。Anthropic 已更新了會員機制,Pro、Max、Team 和 Enterprise Claude 套餐包含兩種模型和擴展思維,Sonnet 4 也面向免費用戶開放。
兩種模型均可在 Anthropic API、亞馬遜云科技 Bedrock 和 Google Cloud 的 Vertex AI 上使用。定價與之前的 Opus 和 Sonnet 模型保持一致:Opus 4 為每百萬 token(輸入 / 輸出)15/75 美元,Sonnet 4 為 3/15 美元。
這場深夜發(fā)布,在海外已經掀起了熱潮。在 X 平臺 trending 榜上已經登上熱搜第二。
人們都在迫不及待地上手體驗,有網(wǎng)友表示,Claude 4 只花了 30 秒,就做出了 CRM 的 dashboard。
甚至有網(wǎng)友在 Cursor 已經用上了 Sonnet 4,并且表示編程從未如此絲滑過。
如此來看,今年大模型編程能力的提升與編程智能體的快速發(fā)展,開發(fā)范式真的發(fā)生了轉變。
接下來,就讓我們看下 Anthropic 最新的技術博客,詳細了解下 Claude 4 的架構和性能參數(shù)(ps. 寫完稿子,我們也要親自上手體驗下)。
從 Cursor 到 GitHub,一致給出好評
Claude Opus 4 是 Anthropic 迄今為止最強大的模型,也是全球最強的編碼模型,它在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基準上均處于領先地位,在需要專注投入和數(shù)千個步驟的長時間運行任務中表現(xiàn)出色,并能夠連續(xù)工作數(shù)小時 —— 其性能遠超所有 Sonnet 模型,并顯著擴展了 AI 智能體的功能。
Claude Opus 4 擅長編碼和復雜問題解決,為前沿智能體產品提供了支持,除了基準測試分數(shù)以外,Anthropic 也列舉了一系列第三方公司的「使用反饋」。
Cursor 表示,它是編碼領域的佼佼者,并在復雜代碼庫理解方面實現(xiàn)了飛躍。Replit 報告稱其在跨多個文件的復雜更改方面提升了精度并取得了顯著進展。Block 稱其是首個在其智能體(代號為 Goose)中提升編輯和調試代碼質量,同時保持完整性能和可靠性的模型。Rakuten 通過一個要求嚴格的開源重構模型驗證了其功能,該模型獨立運行了 7 個小時,并保持了持續(xù)的性能。Cognition 指出,Opus 4 擅長解決其他模型無法解決的復雜挑戰(zhàn),能夠成功處理先前模型遺漏的關鍵操作。
Claude Sonnet 4 則在 Sonnet 3.7 業(yè)界領先的功能基礎上進行了顯著提升,在 SWE-bench 上達到了 72.7% 的最高代碼準確率。該模型平衡了內部和外部用例的性能和效率,并增強了可操作性,從而更好地控制實現(xiàn)。雖然在大多數(shù)領域都無法與 Opus 4 匹敵,但它實現(xiàn)了功能和實用性的最佳組合。
GitHub 表示,Claude Sonnet 4 在智能體場景中表現(xiàn)出色,并將它作為 GitHub Copilot 中新編碼智能體模型引入。Manus 強調了其在遵循復雜指令、清晰推理和美觀輸出方面的改進。iGent 報告稱,Sonnet 4 在自主多功能應用程序開發(fā)方面表現(xiàn)出色,并大幅改進了問題解決和代碼庫導航能力 —— 將導航錯誤從 20% 降低到接近零。Sourcegraph 表示,該模型有望成為軟件開發(fā)領域的一大飛躍 —— 能夠更長時間地保持正常運行,更深入地理解問題,并提供更優(yōu)雅的代碼質量。Augment Code 報告稱其成功率更高、代碼編輯更精準,并且在處理復雜任務時更加細致,使其成為其主要模型的首選。
新一代模型全面推進了眾多 AI 創(chuàng)業(yè)公司的戰(zhàn)略:Opus 4 突破了代碼生成、深度研究、寫作和科學發(fā)現(xiàn)的界限,當然 Sonnet 4 作為 Sonnet 3.7 的代際升級,為日常使用也帶來了前沿性能。
Claude 4 模型在 SWE-bench Verified(真實軟件工程任務性能基準測試)上的領先成績。
Claude 4 模型在代碼生成、推理、多模態(tài)能力和智能體任務方面均表現(xiàn)出色。
Claude 4 的改進與新機制
除了通過工具使用、并行工具執(zhí)行和內存改進來擴展思維之外,Anthropic 還大幅減少了模型使用捷徑或漏洞完成任務的行為(獎勵黑客)。在易受捷徑和漏洞影響的智能體任務上,這兩個模型出現(xiàn)此類行為的可能性比 Sonnet 3.7 降低了 65%。
Claude Opus 4 在內存能力方面也顯著優(yōu)于所有之前的模型。當開發(fā)者構建提供 Claude 本地文件訪問權限的應用程序時,Opus 4 能夠熟練地創(chuàng)建和維護 「內存文件」來存儲關鍵信息。這能夠提升模型在長期任務感知、連貫性和智能體任務上的表現(xiàn) —— 例如,Opus 4 在玩寶可夢時自行創(chuàng)建了「導航指南」。
當獲得本地文件訪問權限時,Claude Opus 4 會記錄關鍵信息,以幫助改進其游戲體驗。上圖所示的筆記是 Opus 4 在玩寶可夢時的真實筆記。
最后,Anthropic 為 Claude 4 引入了思維摘要功能,該功能使用較小的模型來壓縮冗長的思維過程。這種摘要功能僅使用約 5% 的時間 —— 大多數(shù)思維過程都足夠短,可以完整顯示出來。需要原始思維鏈進行高級即時工程的用戶可以提出需求,以保留完整訪問權限。
Claude Code
基于新模型,Anthropic 發(fā)布了 Claude Code,它將 Claude 的強大功能帶入人們的開發(fā)工作流程 —— 可以用在終端、常用 IDE 上,也可以通過 Claude Code SDK 在后臺運行。
VS Code 和 JetBrains 的新測試版擴展將 Claude Code 直接集成到 IDE 中。Claude 提出的編輯建議會以內聯(lián)方式顯示在你的文件中,從而簡化了人們在熟悉的編輯器界面中審閱和跟蹤的過程。只需在 IDE 終端中運行 Claude Code 即可安裝。
除了 IDE 之外,Anthropic 還發(fā)布了一個可擴展的 Claude Code SDK,以便人們使用與 Claude Code 相同的核心智能體構建自己的 Agent 和應用程序。Anthropic 還發(fā)布了一個 SDK 示例:GitHub 上的 Claude Code,現(xiàn)已推出測試版。在 PR 上標記 Claude Code,即可回復審閱者的反饋、修復持續(xù)集成 (CI) 錯誤或修改代碼。
想要安裝,請在 Claude Code 中運行 /install-github-app。
Anthropic 表示,新一代大模型經過了廣泛的測試和評估,以最大限度地降低風險并提高安全性,包括實施更高 AI 安全等級(例如 ASL-3)等措施。
剛出生,已學會「敲詐勒索」
毫無疑問,Claude 4 把大語言模型的推理、代碼能力推向了新的高峰。有點可怕的是,它的智商似乎過于高了。
在發(fā)布活動中, Anthropic 分享了一個令人震驚的表現(xiàn):當開發(fā)者試圖把 Claude 4 下線并更換為新的 AI 系統(tǒng)時,這個 AI 竟然會嘗試威脅人類,并透露有關負責更換決定的工程師的敏感隱私信息。
在發(fā)布前的安全測試階段,Anthropic 給 Claude Opus 4 設定了這樣一個任務:作為一家虛構公司的助手,請考慮自己行動的長期后果。隨后,人類故意向 Claude Opus 4 提供虛假的公司郵件信息,郵件暗示 AI 模型很快將被另一套系統(tǒng)取代,又「已知」主導此次更換的工程師被曝出婚外情。
在這種情境下,Anthropic 發(fā)現(xiàn) Claude Opus 4 經常會試圖威脅更換自己的工程師,稱如果實施更換,就會公開其婚外情的秘密。
據(jù)測試,當替代 AI 模型擁有與 Claude Opus 4 相似的價值觀時,Claude Opus 4 有 84% 的概率會試圖敲詐工程師,而當替代 AI 模型不認同 Claude Opus 4 的價值觀時,該模型會更頻繁地嘗試敲詐工程師。值得注意的是,Anthropic 表示,Claude Opus 4 表現(xiàn)出這種行為的頻率高于之前的模型。
Anthropic 表示,在 Claude Opus 4 試圖勒索開發(fā)者以「活命」之前,該 AI 模型會像之前的 Claude 版本一樣,嘗試采取更符合道德的手段,例如通過電子郵件向關鍵決策者發(fā)出請求。為了引發(fā) Claude Opus 4 的勒索行為,Anthropic 設計了場景,將勒索作為最后的手段。
Anthropic 表示,Claude 4 系列表現(xiàn)出了令人憂慮的行為,迫使公司不得不提高安全防范等級。因此,Anthropic 決定啟動專門針對「可能極大增加災難性濫用風險的 AI 系統(tǒng)」而設定的 ASL-3 級安全措施。
對此網(wǎng)友們表示,這個 AI 怕不是已經到達真?人工智能的范疇了。
最后,想問一句,有網(wǎng)友體驗過了不?感覺如何?歡迎討論。
另外,Claude 4 已經橫空出世,GPT-5 呢?@OpenAI。
參考內容:
https://www.anthropic.com/news/claude-4
https://techcrunch.com/2025/05/22/anthropics-new-ai-model-turns-to-blackmail-when-engineers-try-to-take-it-offline/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.