文章轉載于量子位(QbitAI)
作者:明敏
30年碼齡程序員4年都沒搞定的bug,Claude Opus 4只用幾個小時輕松破解了。
全程只需30個prompt+1次重啟。
而人類在過去4年花了至少200個小時,都沒找到這個bug在哪。
一位資深C++程序員的分享,最近火了。
要知道,他曾在FAANG(指Meta、亞馬遜、蘋果、奈飛、谷歌硅谷五巨頭)擔任工程師,如今也是團隊中“定海神針”一樣的人物。
這個bug不僅困擾他,包括GPT-4.1、Gemini-2.5以及Claude-3.7也找不到。
有圍觀的程序員表示,這種劇情他也經歷過!
一個月沒解決的bug,用o1-Pro十分鐘就搞定了。
Anthropic的開發者關系主管也留言表示,這樣的故事可能會越來越常見。
1
6萬行代碼重構后出現“白鯨bug”
故事的主角名叫ShelZuuz。
這位老哥自稱有30年C++開發經驗,在目前的團隊里承擔“技術支援”的角色,大家卡了一周的問題,他當場就能解決。
從他在Reddit上的資料來看,這些介紹應該不是吹水,他7年來發布的帖子都是和hacker、硬件等相關。
然鵝大佬也有解決不了的難題。
4年前,因為一次設計6萬行代碼的大規模重構,系統里突然出現了一個bug:在一個特定shader(著色器)被特定使用方式下,出現了一個邊界條件下的問題。
大概就是在一種非常特殊的組合條件下才會觸發渲染錯誤,平時難以察覺,但只要觸發就會出錯,屬于典型的頑固型bug。
ShelZuuz老哥表示,這個bug業務優先級不那么高,但也很煩人。在系統沒有重構前,這個bug并不存在。
過去幾年里,他一直在嘗試解決這個問題,零零碎碎花了有200個小時時間,都沒能定位和修復它。
因此,他把這個bug稱為“白鯨bug”。
這是參考了文學作品《白鯨》中,哈克船長執著半生都在追逐一頭行動詭異的白鯨。
這不,最近Claude Opus 4發布了么,老哥就想著用它試試看。
結果配合著Claude Code模式,只用幾個小時,這個bug就被解決了。
Claude Opus 4不僅提供了系統重構前后的完整代碼,并且明確說明了為什么在新架構下會出問題:
舊架構下只是“巧合”地支持了這種用法;
而新架構沒有考慮到這種“非設計性行為”,所以失效;
這并不是常規意義上的邏輯Bug,而是架構層面的兼容性丟失,一種很難發現的問題。
定位bug全程只用了33個提示詞(大概幾個小時)、外加一次重啟。
老哥表示,他之前嘗試過GPT-4.1、Gemini 2.5、Claude 3.7等高級AI模型,但這些模型都沒能找到頭緒,Opus 4是第一個成功定位問題的。
有人就簡單算了筆賬:這樣級別的工程師,200小時工時費2.5萬美元起步,而Claude訂閱費只要200美元(doge)。
也有人補充說,這個結果一定程度上也取決于提示詞的質量,但不得不承認Claude在編程方面真的很強。
1
Claude Opus 4重新定義編碼模型上限
就在上周,Claude 4系列上新,其中Claude Opus 4是旗艦款。
從官方發布中可以明顯感知到,Claude系列正在猛猛提升自己的編程和推理能力。
展示能力的方式都變成了……
同時還發布了Claude Code,也就是前面ShelZuuz用到的能力。
這個智能代碼助手可以幫助開發者通過自然語言命令理解、瀏覽和修改整個代碼庫,讓你能夠將修復bug、實現新功能、代碼重構、編寫測試、跨文件修改等大量工程任務交給AI完成。
發布幾天時間里,全球的開發者們都在嘗試用Claude 4解決各種編程代碼問題。
當然也衍生了一些有趣的玩法,比如讓它用ASCII來張自畫像。
嗯……怎么有點ET的感覺?
[1]https://www.reddit.com/r/ClaudeAI/comments/1kvgg7s/claude_opus_solved_my_white_whale_bug_today_that/?share_id=-Y9J9Hna8rIemyMsG8Jp9&utm_content=1&utm_medium=ios_app&utm_name=ioscss&utm_source=share&utm_term=1
[2]https://x.com/deedydas/status/1927188036560760844
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.