軟件吃掉世界,AI吃掉軟件,Anthropic想吃掉編程AI智能體,它的創始人甚至預言明年將出現一人獨角獸公司。
Anthropic推出了新一代Claude模型,Claude Opus 4 和Claude Sonnet 4,在編程、復雜推理和AI智能體方面顯著超過了OpenAI 03和Gemini 2.5 Pro。
Opus 4 能完成的任務復雜到幾千個步驟,連續工作接近7小時,還能一口氣玩Pokemon 24小時。
除模型外,Anthropic同時宣布推出以下新功能:
工具輔助長程思考(測試版):兩款模型在長程思考過程中均可調用網頁搜索等工具,使Claude能交替進行推理與工具調用以優化回答質量。
增強型模型能力:模型現支持并行工具調用與更精準的指令跟隨。當開發者開放本地文件權限后,模型記憶能力顯著提升——可提取保存關鍵信息以保持對話連貫性,并逐步積累隱性知識。
代碼助手Claude Code正式發布:在研究預覽階段獲得廣泛好評,正擴展開發者與Claude的協作方式。支持通過GitHub Actions執行后臺任務,并與VS Code/JetBrains實現原生集成,可直接在代碼文件中顯示修改建議,實現無縫結對編程。
全新API功能:Anthropic API新增四項開發者能力,助力構建更強大的AI智能體:代碼執行工具、MCP連接器、文件API,以及最長1小時的提示詞緩存功能。
Claude Opus 4 和 Sonnet 4 是混合模型,提供兩種模式:近乎即時的響應和用于更深層次推理的擴展思維。Pro、Max、Team 和 Enterprise Claude 套餐包含兩種模型和擴展思維,Sonnet 4 也面向免費用戶開放。Opus 4 API服務標價輸入/輸出15/75刀,Sonnet 4 是3/15刀。
Claude 4 具備了擴展思維,模型可以在思維的過程中不時調用外部工具或者搜索更多信息,這是由模型自我驅動的,如此循環,直到得出最終答案。這種更具智能體特性的工作過程,并行了推理和驗證完善,可能避免大語言模型不懂就虛構的幻覺毛病。
Claude Opus 4 擅長編碼和解決復雜問題,受到了前沿智能體產品公司的肯定,如Cursor、Replit、Block、Cognition等。值得一提的是,Rakuten在一項要求很高的開源重構項目中,讓Opus 4 獨立運行 7 小時,性能穩定。
Claude Sonnet 4 在智能體場景中表現出色,并將引入 GitHub Copilot。Manus、iGent、Sourcegraph、Augment Code等公司表示,該模型有望成為軟件開發的一大飛躍——能夠更長時間地保持正軌,更深入地理解問題,并提供更優雅的代碼質量。
Claude Opus 4 在內存能力方面也顯著超越了廣受開發者歡迎的Claude 3.7。當開發者構建允許 Claude 訪問本地文件的應用程序時,Opus 4 能夠熟練地創建和維護“內存文件”來存儲關鍵信息。這能夠提升代理在長期任務中的感知能力、連貫性和執行性能。
在產品發布會上,Anthropic創始人阿莫迪(Dario Amodei)感慨,回想Claude 3.7的發布,也就是兩個半月之前的事。
這樣下去,2026年可能出現的開發模式,是一個人盯著一堆編程智能體協作的儀表盤,這可能就是一家獨角獸公司。以后老板每天一睜眼,即將花掉的不再是幾萬元的人工,而是token。
軟件成本大幅下降,將改變軟件開發的經濟邏輯。阿莫迪認為,以前除非是為成千上萬的最終用戶服務,否則你不會開發定制軟件——但現在隨著成本下降,對定制軟件(以及開發人員的技能)的需求將會大幅增長。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.