網易首頁 > 網易號 > 正文申請入駐

30+年碼齡C++大佬敗給Claude 4：“我耗時200+小時、4年未解的Bug，它僅用幾小時就修復了！”

2025-05-28 19:18:10　來源: CSDN

北京舉報

分享至

整理 | 鄭麗媛

出品 | CSDN（ID：CSDNnews）

上周，Anthropic 正式發布了，并將其稱之為“全球最強的編程模型”。當時，有不少開發者對此說法不以為然——Reddit 上一位網名為“ShelZuuz”的 C++ 大佬，或許也是其中之一。

到了本周，ShelZuuz 卻表示：他已經被 Claude Opus 4 “徹底折服”了。

ShelZuuz 可不是一般人。據他自述，他擁有 30 多年的 C++ 開發經驗的，曾在知名大廠（FAANG：Meta、亞馬遜、蘋果、網飛、谷歌）擔任過 Staff Engineer，幾乎是團隊里的“定海神針”，別人搞不定、困擾一周的難題，最終都會找到他來解決。

但就是這樣一位大神，卻被一個困擾了他長達四年的“白鯨 Bug”折磨得夠嗆（注：一種在特定條件下會觸發渲染錯誤的 Bug，通常在大規模代碼重構后出現）——而本周，他終于在 Claude Opus 4 的幫助下，成功解決了這個長期未解的難題！

困擾了他 4 年的“白鯨 Bug”

根據 ShelZuuz 的分享，這個 Bug 要追溯到四年前。

當時，他在重構一個有 6 萬行代碼的項目，原本是期望通過這次重構解決老系統遺留的諸多問題，讓整個系統運行得更加順暢高效?？蓻]想到，這次重構卻意外引入了一個棘手的新麻煩。

具體來說，是某個特殊著色器在某些特定 GPU 設置和調用路徑下會出現渲染異常，導致系統出現故障?？蓡栴}在于：它不容易重現，也不會報錯，有時你連“哪里出了問題”都說不清楚。

于是，他開始了一場沒有終點的 Bug“獵殺”。

這四年來，ShelZuuz 斷斷續續地來回找這個 Bug，估計花了至少有 200 個小時?；蛟S研究一段底層渲染代碼幾個小時也徒勞無功、以為找到了問題關鍵、修改后卻 Bug 依舊……正如 ShelZuuz 將其稱為“白鯨 Bug”的原因：這個 Bug像極了小說《白鯨記》里的莫比·迪克——神出鬼沒、近在咫尺卻永遠抓不住。

而就在最近，他突然心血來潮，嘗試把這個“白鯨 Bug”丟給 Claude Opus 4 來分析。畢竟，Anthropic 能自信把 Claude Opus 4 叫做“全球最強的編程模型”，它總得有點東西不是？

結果，原本這個 ShelZuuz 壓根不寄予厚望、只想著隨便試試的 Claude Opus 4，真的抓到了這個“白鯨”的尾巴！

我和運行 Opus 4 的 Claude Code 一起工作了幾個小時，給了它訪問舊代碼和新代碼的權限，并告訴它去找出重構中的問題所在。結果它找到了！原來，在舊代碼中能正常運行的原因僅僅是舊架構的巧合，而當我們改變架構時，并沒有考慮到這種巧合。因此，這不僅僅是一個引入的邏輯錯誤，它還發現了更改后的架構設計沒有考慮到這個舊的邊緣情況。

更令 ShelZuuz 驚訝的是，整個過程僅用了幾個小時，一共只花了大約 30 次提示和一次重啟——要知道，在此之前他也嘗試過用 GPT-4.1、Gemini 2.5 pro 以及 Claude 3.7 來解決這個 Bug，但都沒有任何進展。

Claude Opus 4 是怎么做到的？

許多開發者都好奇，Claude Opus 4 具體是怎么做到的？為此，ShelZuuz 給出了詳細過程。

首先是項目結構準備。他將老版本的代碼放入 /proj/oldsrc，新版本代碼放入 /proj/src，統一打開 VSCode 的 /proj 目錄。Claude 就可以在一個會話中同時看到兩份代碼。

其次是 prompt。ShelZuuz 透露，他的初始提示詞大概只有 10 行，主要描述問題所在，并引導 Claude 去掃描整個項目（加起來約 200 萬行代碼）。而整個過程用了約 30 條 prompt，最長的一條 prompt 超過 1500 行，多是根據 Claude 要求他插入 printf 語句后的運行日志，以便理解代碼流程。

準備工作完成后，Claude 便開始找這個“白鯨 Bug”：

（1）自動 grep 項目中相關函數和路徑，無需人工指定文件；

（2）基于現象分析執行路徑，并自行在舊代碼和新代碼中對比找出關鍵差異；

（3）過程中 Claude 曾多次誤判路徑，但 ShelZuuz 會通過補充說明幫助它及時修正方向；

（4）最終，Claude 發現了一個由于重構導致的非顯式依賴丟失：一個函數依賴的初始化流程在新版中被移動，造成執行路徑靜默中斷。

ShelZuuz坦言，好幾次 Claude 都說“我找到問題了！”，但他都不信，因為 AI 總是這么說。但最后一次，他跑了一下代碼，Bug居然真的修復了，而且沒有引入其他問題。

但是，Claude依然只是“初級開發者”

既然如此，那 AI 真的比人類還強、可以取代人類了？而對于這個問題，ShelZuuz 在評論中多次強調：雖然 Claude 解決了這個大問題，但它本質上更像是一個“能干的初級程序員”。

這聽上去有點貶低？不，恰恰相反。

他舉例道：

“我最近用 Claude 做了一個全棧項目，大概花了 200 個 prompt。你可以想象一個新人程序員在 6 個月里通過 200 次問題和代碼審查來推進項目。而 Claude 只花了3天。它確實更快，但需要的‘手把手指導’的工作量其實相當。”

他指出，AI 并不是“自動完成”任務的魔法工具，它更像是你團隊中的一個“不會上廁所但一直問問題”的實習生——你得時刻關注它的方向，引導它別繞遠路、別誤刪代碼、別浪費時間在錯的方向上。

ShelZuuz 總結道：AI 在開發中需要的指導時間，相當于團隊中有一個初級開發者，而非高級開發者。因此，如果讓他在 30 個高級程序員和一個 AI 之間選，他還是會毫不猶豫地選擇人類：“光從對 Tech Lead（技術主管）的負擔角度來說，我更愿意管理高級開發者。”

不過，不同于 ShelZuuz 的看法，許多開發者仍認為使用 AI 比雇傭工程師的成本要低得多。

以 ShelZuuz 使用的 Claude Max 為例，其每月訂閱費為 100 美元，相較于資深工程師 200 小時工時費約 2.5 萬美元來說，至少在這件事上可以看出，AI 在提高開發效率、降低開發成本方面有著巨大潛力。

https://www.reddit.com/r/ClaudeAI/comments/1kvgg7s/claude_opus_solved_my_white_whale_bug_today_that/

2025 全球產品經理大會

2025 年 8 月 15–16 日

北京·威斯汀酒店

2025 全球產品經理大會將匯聚互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人，圍繞產品設計、用戶體驗、增長運營、智能落地等核心議題，展開 12 大專題分享，洞察趨勢、拆解路徑、對話未來。

更多詳情與報名，請掃碼下方二維碼。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.