99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Claude 4 發布:實測代碼更強,反華但 Cue 了 Manus

0
分享至

今天凌晨,Claude 4 系列模型發布,包括:

  • ? Claude Opus 4 (旗艦)

  • ? Claude Sonnet 4 (主力)

這兩款模型同時支持擴展推理(extended thinking)、工具調用、文件讀取、并行任務等 Agent 工作流所需核心能力。

實測:能完成較為復雜任務

在 WebApp 上,Sonnet 免費,Opus 4 付費
在 API 上,定價與前代一致,每百萬 token:
Opus 輸入 $15,輸出 $75
Sonnet 輸入 $3,輸出 $15

編程能力提升

作為旗艦模型的 Claude Opus 4 ,針對復雜編程場景,進行了很多優化:

  • ? 跨文件編輯能力 :模型可識別項目結構,在多個文件間同步修改,減少遺漏;

  • ? 復雜指令執行 :更好地解析多條件、分步驟的請求;

  • ? 長時間任務保持 :具備較強的上下文記憶能力,適合執行耗時較長的流程;

  • ? 邏輯完整性增強 :在多步推理中更少出現跳步或模板式回答的問題。

根據公開基準測試數據,在 SWE-bench 中得分為 72.5%,在 Terminal-bench 得分為 43.2%。這兩個得分均高于 GPT-4.1(67.4%)和 Gemini 1.5 Pro(66.6%)。


編程相關跑分

另外的,你會發現 Claude Sonnet 4 在 SWE-bench 得分為 72.7%,略高于 Opus 4。
該模型是對 Sonnet 3.7 的升級,提升了響應速度和執行精度,適合在原有場景中替代舊版使用。


SWE-bench 新能力加入

除了模型本身外,Claude 4 系列還做了幾項關鍵能力提升:

  • ? 工具調用能力(beta) :模型可以在中途調用工具(如 Web 搜索、本地文件讀取、代碼執行),用于補充信息或運行指令,適配更多類 Agent 工作流。

  • ? 并行工具使用 :多個工具調用可同時進行,任務拆解與執行效率提升,適合復雜任務路徑或并發型指令。

  • ? 內存機制增強 :開發者授權 Claude 訪問本地文件后,模型可以創建“記憶文檔”,記錄上下文關鍵信息,增強長任務一致性和延續性。

通過記憶劇情,讓 AI 玩寶可夢
  • ? 規避任務“捷徑”行為 :Anthropic 表示 Claude 4 系列在容易作弊的任務中,出現“偷懶”行為(如跳過中間步驟)的概率減少了 65% ,使得多步驟任務執行更穩、更可控。比如下面,這種可惡的代碼省略:

  • def square_numbers(numbers):     result = []     for n in numbers:         # ...省略:計算平方         result.append(n)  # 本應是 result.append(n ** 2)     return result # 測試 nums = [1, 2, 3, 4] print("Squared:", square_numbers(nums))  # 輸出 [1, 2, 3, 4],但本應是 [1, 4, 9, 16]

這些東西吧,它沒辦法體現在跑分離,但在很多編程自動化領域,會非常受用。

Claude Code 更新

Claude Code 已正式開放,方便開發者可以把 Claude 更深地嵌入日常開發流程。新增內容包括:

  • ? 支持 GitHub Actions :Claude 可以作為后臺 Agent 執行代碼任務。

  • ? 原生集成 IDE :提供 VS Code 和 JetBrains 插件,Claude 的修改建議會直接以“行內標注”的方式呈現在代碼中,無需額外切換。

  • ? Claude Code SDK :開發者可以用它來自定義自己的 Agent,或構建 AI 協同工具。

  • ? GitHub 實例(Beta) :可以 @Claude Code 參與 PR 審查,自動響應修改建議、修復 CI 報錯等。

實測

我一直想跑這么一個任務,但無論 GPT、Gemini 還是之前的 Claude 都沒有成功:

生成 3D 演示動畫,像中學生演示四沖程發動機的工作原理

但在這個這次的 Claude 4 里跑通了:

過程如下

然后...吐個槽,怎么感覺額度消耗的好快,這就讓我去加錢了


基礎的 Pro 套餐,真的用幾下就沒了 Manus 出現在官方發布中

在這次發布中,Anthropic 引用了多個第三方開發者工具的反饋,包括 GitHub、Sourcegraph、Augment Code 等。值得注意的是,國產 Agent 工具 Manus 的評價也被收錄:

Manus highlights its improvements in following complex instructions, clear reasoning, and aesthetic outputs.

這是目前為止 首次有國產 Agent 工具出現在 Anthropic 的正式發布文檔中
考慮到 Anthropic 長期對中國市場較為保守的公開態度(中譯中:反華),這條引用頗有趣味。

附1:Anthropic CEO 的萬字檄文 附2:相關鏈接

Claude Webapp
www.claude.ai

Claude API 文檔
docs.anthropic.com

Claude Code GitHub 應用
github.com/anthropic/claude-code

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
C羅制勝一擊,刷爆3大紀錄!2-1逆轉德國,葡萄牙挺進決賽

C羅制勝一擊,刷爆3大紀錄!2-1逆轉德國,葡萄牙挺進決賽

我的護球最獨特
2025-06-05 05:09:39
山東重磅發布!住院不用家屬陪護,2025年全面推行!

山東重磅發布!住院不用家屬陪護,2025年全面推行!

醫脈圈
2025-06-04 20:33:32
1號臺風蝴蝶將生成,直奔廣東?!全國多地熱到爆,地表溫度超60℃!

1號臺風蝴蝶將生成,直奔廣東?!全國多地熱到爆,地表溫度超60℃!

農財寶典水產版
2025-06-04 20:21:25
菲律賓參議院彈劾投票結束,莎拉做兩手準備,軍方態度成關鍵

菲律賓參議院彈劾投票結束,莎拉做兩手準備,軍方態度成關鍵

大頭博士記
2025-06-05 04:49:04
廣西38樓孕婦鐵鏈鎖電梯,業主群炸鍋,網友:懷個孕真當女皇了?

廣西38樓孕婦鐵鏈鎖電梯,業主群炸鍋,網友:懷個孕真當女皇了?

史行途
2025-06-04 22:59:29
特朗普,突發!中概股大漲!美股飄紅

特朗普,突發!中概股大漲!美股飄紅

證券時報e公司
2025-06-04 22:39:14
震驚!她剛剛宣布正式退出民主黨,拜登時代徹底終結

震驚!她剛剛宣布正式退出民主黨,拜登時代徹底終結

華人生活網
2025-06-05 03:47:03
成都被中央欽點,高速擴容改造來襲,斥資488億即開工!

成都被中央欽點,高速擴容改造來襲,斥資488億即開工!

生活靈感盒
2025-06-05 02:04:35
知名港星到梅州看房,大贊環境宜居!已在內地買5套房留給子孫

知名港星到梅州看房,大贊環境宜居!已在內地買5套房留給子孫

大笑江湖史
2025-06-04 15:56:46
中國主動公布東風5說明美國已經走在軍事冒險的路上了!

中國主動公布東風5說明美國已經走在軍事冒險的路上了!

林子說事
2025-06-04 17:14:26
對人生感到迷茫時,就去狠狠地看這部電影??

對人生感到迷茫時,就去狠狠地看這部電影??

楓塵余往逝
2025-06-04 07:29:54
李在明當上總統,秋瓷炫贏麻了!2個選擇直接把爛牌變王炸!

李在明當上總統,秋瓷炫贏麻了!2個選擇直接把爛牌變王炸!

夢史
2025-06-04 11:43:35
繼韓國越南之后,巴基斯坦也貼出中文標語,句句戳中國游客的心

繼韓國越南之后,巴基斯坦也貼出中文標語,句句戳中國游客的心

侃侃兒談
2025-05-05 09:49:14
破案了!終于知道具俊曄為什么暴瘦!原來他每天都去金寶山看大S

破案了!終于知道具俊曄為什么暴瘦!原來他每天都去金寶山看大S

小娛樂悠悠
2025-05-13 07:50:26
蛻變!維蒂尼亞4年前坐穿狼隊替補席身價700萬,現8000萬巴黎真核

蛻變!維蒂尼亞4年前坐穿狼隊替補席身價700萬,現8000萬巴黎真核

直播吧
2025-06-04 14:51:03
被踢出中國市場!壟斷中國市場30年,卻揚言絕不培養中國員工

被踢出中國市場!壟斷中國市場30年,卻揚言絕不培養中國員工

紅夢史說
2025-06-04 07:50:03
美國不挽留,中國不收留!被視為“間諜”的中國留學生,沒了出路

美國不挽留,中國不收留!被視為“間諜”的中國留學生,沒了出路

涵豆說娛
2025-06-04 15:41:26
起底亂港分子周庭,從小壞到大

起底亂港分子周庭,從小壞到大

混沌錄
2025-06-04 19:28:06
決戰時刻到來,菲律賓參議院彈劾投票結束,莎拉有兩手準備

決戰時刻到來,菲律賓參議院彈劾投票結束,莎拉有兩手準備

影孖看世界
2025-06-04 18:31:35
《科學》:男性中年或注定發福,這很難改變,與新陳代謝無關

《科學》:男性中年或注定發福,這很難改變,與新陳代謝無關

大象新聞
2025-06-04 15:51:10
2025-06-05 09:15:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
46文章數 4關注度
往期回顧 全部

科技要聞

人形機器人千億投入 年產量不如勞力士一周

頭條要聞

家長請事假陪孩子高考被開除 起訴公司官司打到高院

頭條要聞

家長請事假陪孩子高考被開除 起訴公司官司打到高院

體育要聞

從次輪末到樂透邊緣 楊瀚森的試訓有什么玄機?

娛樂要聞

彭于晏方出面澄清與蔡依林復合戀情!

財經要聞

美聯儲褐皮書:不確定性和關稅壓力加劇

汽車要聞

車機升級 新款AION Y Plus上市售9.98萬起

態度原創

時尚
數碼
本地
家居
公開課

30套高智感通勤穿搭,照著穿就很時髦

數碼要聞

AMD收購Brium 瞄準NVIDIA在AI硬件領域的主導地位

本地新聞

《中國匠人——錦繡中國》即日上線:解讀千年絲線的東方美學密碼

家居要聞

空間維度 通透復式結構

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 微博| 和平区| 洪江市| 黑河市| 论坛| 铜陵市| 三江| 介休市| 太仆寺旗| 洛川县| 星子县| 铜梁县| 南康市| 乡城县| 顺义区| 沿河| 庆元县| 大新县| 云和县| 宝清县| 新密市| 成都市| 岚皋县| 二手房| 乌拉特前旗| 克山县| 中阳县| 浦东新区| 襄垣县| 鄂伦春自治旗| 遂溪县| 宁明县| 什邡市| 忻城县| 霍林郭勒市| 石渠县| 明光市| 桐城市| 湟中县| 商水县| 绩溪县|