5月23日 亞馬遜云科技宣布在Amazon Bedrock中推出Anthropic的最新一代模型Claude Opus 4和Claude Sonnet 4。這兩款全新混合推理模型能夠根據需求在快速響應和深度思考模式間靈活切換,為編碼、高級推理和多步驟工作流領域帶來全新標準。它們不僅能在復雜的長時間推理任務中保持穩定的性能,更能驅動AI agents將耗時數小時的任務濃縮至數分鐘內完成。Claude Opus 4和Claude Sonnet 4在Amazon Bedrock的推出,進一步豐富了客戶使用Anthropic最先進的模型進行AI創新的選擇,幫助客戶打造更出色、更具變革性的應用,同時具備企業級安全防護和負責任的AI管控體系。
全新Claude 4模型從根本上改變了團隊處理復雜項目的方式。對于需要持續投入和深度專業知識的大型企業而言尤其如此。Claude Opus 4擅長以極高準確率處理復雜多步驟任務,例如協調跨職能工作流或跨多個數據源進行深度研究。Anthropic表示,Claude Opus 4是全球最佳編碼模型,可獨立完成從規劃到執行的復雜編碼項目和agent工作流。該模型還能以自然語言生成長篇創意內容。金融行業客戶可利用Claude Opus 4進行agent搜索與研究,例如連接海量市場報告以獲取行業洞察;營銷類客戶則可利用該模型自主管理多渠道的營銷活動。
Claude Sonnet 4在編碼和推理能力上超越前代Claude Sonnet 3.7,它平衡性能與成本,特別適合高吞吐量的業務場景,是大多數生產級應用的理想之選。Claude Sonnet 4可為各類業務賦能,從實時客服agents到日常開發工作(如代碼審查與漏洞修復),并作為任務專用的子agents同時處理搜索、數據分析或內容合成等多類任務。旅游與酒店行業客戶可使用Claude Sonnet 4近乎實時處理客戶請求并提供個性化響應。
兩款模型均支持“擴展思考”功能,使Claude能在深度推理與行動執行模式間切換。Claude可按需運行數據分析,并在工作過程中提升準確性,這使它能更好地預測并執行后續步驟。
Claude Opus 4如同注重細節的協作伙伴,可執行如編碼、研究與內容創作等長期任務。Claude Sonnet 4則以高效見長,在每個項目中都能完美融合快速思考與實用智能。Claude Sonnet 4在保持高性能的同時兼具出色的速度,可以在多個任務間自如切換,始終秉持務實態度,確保一次性高質量完成任務。
Anthropic增長與營收負責人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4將AI從工具變為真正的協作伙伴。我們的客戶將體驗到項目周期的大幅縮短——將原本需要數周完成的項目壓縮至數小時。Claude 4系列模型在編碼、高級推理和多步驟工作流等方面樹立了新標準,它們不僅能夠深入理解業務背景,還能提供精準的解決方案。這帶來了真正的突破,讓企業人才能夠專注于戰略工作,而繁重的日常任務則由Claude承擔。”
Snorkel AI聯合創始人Henry Ehrenberg表示:“在agentic系統與企業數據集(尤其是需要使用工具并進行多輪交互的場景)的準確性上,Claude Opus 4正推動技術前沿。我們的研究團隊使用Snorkel的精細化評估平臺,針對實際保險承保場景對Claude Opus 4進行了基準測試。結果顯示,在特定業務線等關鍵數據子集的處理上,Claude Opus 4的表現顯著優于其他推理模型。”
Block首席數據和機器學習工程師Bradley Axen表示:"Claude Opus 4是首個能在我們代號為'goose'的Agent中提升代碼編輯和調試質量的模型,同時還能保持出色的性能和可靠性。"
數據亮點
· 兩款模型均支持200K token上下文窗口,可高質量處理或生成長篇內容(如文檔分析與研究)。Token是模型能夠處理的最小文本數據單位(例如,一個單詞、短語或單個字符)。較長的回復對于生成豐富的代碼和內容尤其有效。
· Anthropic表示,Claude Opus 4在衡量現實世界能力的關鍵行業測試中設定了新的性能標準:其解決復雜軟件工程問題的能力超越前代AI模型(Software Engineering Benchmark),并在輔助Agentic任務時提供更準確響應(Tool-Agent-User Interaction benchmark),同時顯著提升指令遵循與信息可靠性。
· 這些模型可在快速直接回答與分步思考間切換,從而在關鍵行業基準測試中大幅提升多步驟工作流程的表現。
· Claude系列模型廣受客戶歡迎,以Anthropic的上一款模型Claude Sonnet 3.7為例,該模型在發布后的五周內,Amazon Bedrock客戶使用率比同期的上一代Claude模型高出300%。
新一代Claude模型的推出標志著agentic AI能力的重大飛躍,將徹底改變企業部署AI的方式,既包括處理復雜任務,也包括高吞吐量的日常運營。Claude Opus 4和Sonnet 4不再僅僅生成內容,而是更像專業的虛擬協作伙伴——專注復雜任務、保留上下文,并在無需持續指導下提供完整的解決方案。這一能力改變了企業應對各種挑戰的方式,從開發軟件系統到制定全面的營銷策略。對于普通用戶而言,它意味著與更理解需求的AI協作,且AI能獨立承擔更大比例的項目工作。
Anthropic表示,Claude Opus 4和Sonnet 4的推出將讓AI系統成為能力不斷增長的協作伙伴,包括創意與知識工作。例如:在企業中承擔更專業的角色,如處理常規分析、跨部門協調,甚至在極少監督的情況下管理完整的工作流程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.