網易首頁 > 網易號 > 正文申請入駐

最強編碼模型Claude 4，將加快一人獨角獸公司出現，就在明年

2025-05-23 22:58:06　來源: 未盡研究

上海舉報

分享至

軟件吃掉世界，AI吃掉軟件，Anthropic想吃掉編程AI智能體，它的創始人甚至預言明年將出現一人獨角獸公司。

Anthropic推出了新一代Claude模型，Claude Opus 4 和Claude Sonnet 4，在編程、復雜推理和AI智能體方面顯著超過了OpenAI 03和Gemini 2.5 Pro。

Opus 4 能完成的任務復雜到幾千個步驟，連續工作接近7小時，還能一口氣玩Pokemon 24小時。

除模型外，Anthropic同時宣布推出以下新功能：

工具輔助長程思考（測試版）：兩款模型在長程思考過程中均可調用網頁搜索等工具，使Claude能交替進行推理與工具調用以優化回答質量。

增強型模型能力：模型現支持并行工具調用與更精準的指令跟隨。當開發者開放本地文件權限后，模型記憶能力顯著提升——可提取保存關鍵信息以保持對話連貫性，并逐步積累隱性知識。

代碼助手Claude Code正式發布：在研究預覽階段獲得廣泛好評，正擴展開發者與Claude的協作方式。支持通過GitHub Actions執行后臺任務，并與VS Code/JetBrains實現原生集成，可直接在代碼文件中顯示修改建議，實現無縫結對編程。

全新API功能：Anthropic API新增四項開發者能力，助力構建更強大的AI智能體：代碼執行工具、MCP連接器、文件API，以及最長1小時的提示詞緩存功能。

Claude Opus 4 和 Sonnet 4 是混合模型，提供兩種模式：近乎即時的響應和用于更深層次推理的擴展思維。Pro、Max、Team 和 Enterprise Claude 套餐包含兩種模型和擴展思維，Sonnet 4 也面向免費用戶開放。Opus 4 API服務標價輸入/輸出15/75刀，Sonnet 4 是3/15刀。

Claude 4 具備了擴展思維，模型可以在思維的過程中不時調用外部工具或者搜索更多信息，這是由模型自我驅動的，如此循環，直到得出最終答案。這種更具智能體特性的工作過程，并行了推理和驗證完善，可能避免大語言模型不懂就虛構的幻覺毛病。

Claude Opus 4 擅長編碼和解決復雜問題，受到了前沿智能體產品公司的肯定，如Cursor、Replit、Block、Cognition等。值得一提的是，Rakuten在一項要求很高的開源重構項目中，讓Opus 4 獨立運行 7 小時，性能穩定。

Claude Sonnet 4 在智能體場景中表現出色，并將引入 GitHub Copilot。Manus、iGent、Sourcegraph、Augment Code等公司表示，該模型有望成為軟件開發的一大飛躍——能夠更長時間地保持正軌，更深入地理解問題，并提供更優雅的代碼質量。

Claude Opus 4 在內存能力方面也顯著超越了廣受開發者歡迎的Claude 3.7。當開發者構建允許 Claude 訪問本地文件的應用程序時，Opus 4 能夠熟練地創建和維護“內存文件”來存儲關鍵信息。這能夠提升代理在長期任務中的感知能力、連貫性和執行性能。

在產品發布會上，Anthropic創始人阿莫迪（Dario Amodei)感慨，回想Claude 3.7的發布，也就是兩個半月之前的事。

這樣下去，2026年可能出現的開發模式，是一個人盯著一堆編程智能體協作的儀表盤，這可能就是一家獨角獸公司。以后老板每天一睜眼，即將花掉的不再是幾萬元的人工，而是token。

軟件成本大幅下降，將改變軟件開發的經濟邏輯。阿莫迪認為，以前除非是為成千上萬的最終用戶服務，否則你不會開發定制軟件——但現在隨著成本下降，對定制軟件（以及開發人員的技能）的需求將會大幅增長。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.