99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

人類擊敗AI編程奪冠!奧特曼點贊,16個頂級碼農(nóng)實測揭秘:AI編程竟是「效率幻覺」

0
分享至

Humanity has prevailed (for now!)
人類暫時取得了勝利!

昨天,在東京舉行的 AtCoder 2025 世界巡回賽中,一位人類選手 Psyho 以較大差距暫時擊敗了 OpenAI 提交的自動化程序 OpenAIAHC,拿下榜首。


AtCoder World Tour Finals 是 AtCoder 主辦的一年一度的賽事,旨在決出競技編程的世界冠軍。第一是來自波蘭的 Psyho,OpenAIAHC 排在第二。

消息一出,連 OpenAI CEO 奧特曼都親自轉(zhuǎn)發(fā)了,配文「干得好,Psyho!」

這場勝利確實值得歡呼,但它始終是暫時的。OpenAIAHC 排在第二名緊追不舍,AI 參與編程競賽的實力越來越強,從零調(diào)試的程序已經(jīng)逼近人類頂尖選手。

正如當年 AlphaGo 「大戰(zhàn)」李世石那樣,AI 編程的優(yōu)勢也正在一點點顯現(xiàn),逐步占據(jù)主導地位。

今天的開發(fā)者,正在被 Claude Code、Gemini CLI、Cursor 等工具團團圍住,不再是「用不用」的問題,而是「怎么用」。

最近 Kimi K2 發(fā)布,讓 Claude Code 又火了一把。很多人第一時間注意到的,除了 K2 跑得多快、模型多大,還有它的 API 接入了 Claude Code。

啟動 Claude Code,寫上一段 prompt,回車,一大段結(jié)構(gòu)清晰的函數(shù)就寫好了。Gemini CLI,Cursor,同樣如此。

編程從一個人對抗 bug 的痛苦過程,變成了一個跟 AI 一起搭積木的創(chuàng)意游戲。甚至有個很好聽的名字叫 Vibe Coding(氛圍編程,通過提示詞與 AI 協(xié)作編程)。

非常多的人在社交媒體上分享自己 Vibe Coding 的經(jīng)歷,有人表示 Claude 是「目前用過最強的代碼助手」,不過也有經(jīng)驗豐富的開發(fā)者分享使用 Claude 的痛苦經(jīng)歷。


AI 寫的代碼也被一些經(jīng)驗豐富的開發(fā)者感覺到「惡心」

Vibe Coding 到底行不行?是編程大賽勇奪第二的智能,還是在日常編程里一次次的「被惡心」。就在不久前,一項新的研究給 AI 編程潑了一盆冷水。

一項反直覺的研究:AI 編程,可能更低效

最近,美國 AI 安全機構(gòu) METR 公布了一項針對 Claude 3.5/3.7 的實測研究。他們找來了 16 名經(jīng)驗豐富的開源開發(fā)者,讓他們在熟悉的項目中使用 Claude Code 輔助編程。


16 名經(jīng)驗豐富的開發(fā)者參與實驗的結(jié)果(紅色),以及從左到右經(jīng)濟學家、機器學習專家、和開發(fā)者在參與研究過程中和之后的預測結(jié)果(綠色)。

結(jié)果讓很多人驚訝:

開發(fā)者使用 AI 后,完成任務的時間平均增加了 19%。

更有趣的是,雖然結(jié)果是變慢了,但參與者自我報告的感覺是變快了!他們覺得 AI 幫了很大的忙,寫得更順了,效率提升了 20%。

「AI 幻覺」好像轉(zhuǎn)移到了人類身上,變成一種「效率幻覺」,你以為你變快了,但其實你只是感覺變快了。

為什么會這樣?研究總結(jié)了下面幾個原因,

寫 prompt 很花時間,而且經(jīng)常要改來改去;

Claude 給出的代碼大多不能直接用,需要手動改邏輯、查 bug;

你在「提示 - 等待 - 修改」的循環(huán)中,陷入了一種「被打斷的狀態(tài)」。

看到這兒,我們也開始好奇,那我們自己用這些工具寫點東西,會不會也遇到同樣的問題?

于是我們做了一個小實驗。

Vibe Coding 真的能讓你飛起來嗎?

我們設計了一個看起來不難、但邏輯不算太簡單的小任務:

寫一個命令行工具,輸入關鍵詞,返回知乎熱榜中含該關鍵詞的帖子標題,限制輸出條數(shù)。

這個任務包含了網(wǎng)絡請求、HTML 解析、字符串匹配、命令行參數(shù)解析,剛好可以試試 Claude Code 和 Gemini CLI 的能力。

這里我們使用 Gemini CLI 來完成這個任務,雖然在命令行里面使用中文真的很違和,但是 Gemini CLI 和 Claude Code 都能支持中文的輸入。





動作還是非常快的,可能因為任務比較簡單,代碼生成的過程并不需要等待很久。它首先自動生成了需要安裝哪些庫,可以用來爬取網(wǎng)頁,接著生成了 main.py,核心的代碼文件。



中間遇到的問題是知乎需要登錄,它還自動使用 Google 幫我搜索了一個公開的 API,以及嘗試使用其他的工具,但是仍然沒有用。最后它告訴我需要我自己輸入 Cookie。


雖然短時間內(nèi)它沒有幫我完成這個任務,但整個體驗的過程確實很舒適。像是指揮實習生去完成工作,實習生做得不好不可以罵,但是 Vibe Coding 里面能直接罵 Gemini CLI。

在使用 Kimi K2 的 Claude Code 時,同樣的,我們嘗試讓他從零開始完成一個科研任務。在一個空文件夾中,我告訴 Claude Code 說,我要發(fā)一篇 CVPR(計算機視覺頂級會議) 的文章,我有一個具體的方向,你需要幫我寫代碼完成這個實驗。



結(jié)果是,等到我把 Kimi K2 的免費 API Token 都用完了,整個項目還是約等于一個零。他先是自信的給我生成了全部的訓練代碼、網(wǎng)絡結(jié)構(gòu)代碼、數(shù)據(jù)集代碼、測試代碼等等,然后告訴我說可以運行了。

我說你這個方法根本不 Novelty(創(chuàng)新),他說確實是。然后我要他去找最近兩年的論文,接下來他就把我的 Token 全部消耗完了。

由于整個過程還是比較短的時間,我沒有做太多的人為干預,完全交給 AI 去處理。即便是中間遇到了問題,我也是讓 AI 自己去解決。

我覺得,他有一個最大的好處,它幾乎可以完全控制這臺電腦,不需要我去給他提供額外的上下文信息。

爽感 vs 效率,AI 編程可以魚熊掌兼得嗎?

這次小測試,讓我印象最深的是,AI 給我的更多是「爽感」,而不是「效率」。

你會感到自己像個編程高手,代碼像魔法一樣自動冒出來,但一旦報錯或邏輯不通,會發(fā)現(xiàn)你其實沒有真正理解這段代碼,也不太知道怎么改。

但我仍然覺得工具本身沒有問題,如何使用工具才是決定能否發(fā)揮它潛力的重要因素。


來自 OpenAI 的 Sean Grove 在 AIEWF2025 上發(fā)表「新的代碼」演講

在 OpenAI 從事對齊推理工作的 Sean Grove 在最近的一個演講里面則提到,在使用 AI 編程工具時重要的不是提示工程,而是「規(guī)范」。

當前的「Vibe Coding」存在一個問題,我們保留了 AI 生成的代碼,卻丟棄了包含我們原始意圖的提示詞。這就像「把源代碼撕掉,只對編譯后的二進制文件進行版本控制」一樣,是不可持續(xù)的。

編程的未來不再僅僅是編寫代碼,而是通過規(guī)范(Specification)來定義和傳達意圖。真正的瓶頸和價值在于結(jié)構(gòu)化的溝通,而「規(guī)范」正是這種溝通的最終體現(xiàn)。

有一位參與了文章開頭提到的那項研究的開發(fā)者,在 X 上分享了自己參與的經(jīng)歷,他說自己就是那個用了 Vibe Coding,效率降低了 38% 的人。


他認為 LLM 只是工具,不要期待它是一顆「萬能靈丹」。除了只有特定類型的編程任務,才擁有大量干凈的訓練數(shù)據(jù)這一缺點之外,還有像是上下文退化、在等待生成的過程中分心、以及 LLM 代碼工具沒有準確的成功衡量標準等「長尾問題」。

不過最后他也提到「如果我們想用好這個新工具,就必須理解它(以及我們自己)的短板,并主動去適應。」

那么,真的可以有一種方法,讓所有人在使用這些 AI 編程工具的時候,同時收獲效率和爽感嗎?

除了這些「糟心」的體驗分享,X 上也有非常多的用戶分享自己使用這些 AI 編程工具提高生產(chǎn)力效率。


有人說 Claude Code 可以像你一樣去使用你的電腦,他創(chuàng)建了一個 Claude.md 文檔,在這個文檔里,告訴 Claude 如何訪問他文件夾中的重要目錄。像是用于回憶、日記、想法、代碼、待辦事項、便簽和腳本等不同的文件夾。

此外,他還創(chuàng)建一些自定義命令,用于創(chuàng)建日志的 /journal 命令,還有用于創(chuàng)建待辦事項的 /todos 命令。Claude Code 能夠在這些文件里面添加內(nèi)容時,自動檢索它的電腦文件,做到真正的智能助手。

他還分享了使用 MCP 連接到除了電腦本地資源以外的更多網(wǎng)絡信息,能連接 Notion、地圖軟件、在線辦公應用等等來進一步提升效率。他說 Claude Code 幾乎能高效的幫助他,完成所有的工作。

對我來說,很明顯我們遇到的瓶頸不是模型能力,而是創(chuàng)造力和理解力。

還是忍不住感慨,AI 編程的發(fā)展實在太快了……


2025 年最佳編程 AI:6款必備頂級 AI 工具,圖片來自:pragmaticcoders.com,2025-06-24

從一開始還是只能在側(cè)邊欄里調(diào)用 GitHub Copilot,到后來豐富的 Agentic AI 編程工具,像是「Tab」一下的 Cursor、WindSurf、Trae,還有亞馬遜也在最近推出了 Kiro,等等。

今年,再來到了從 GUI(圖形用戶界面)到 CLI(命令行界面)的轉(zhuǎn)變,有了 Claude Code 和 Gemini CLI……而這一切竟然就是發(fā)生在最近兩三年的時間里。

所以,我想對于這樣一個飛速發(fā)展的技術(shù),我們更多的應該關注它的趨勢,而不應該是瑕疵。而 趨勢的意義從來不在于它今天多成熟,而在于我們是否愿意 早點動手試一試,摸清它的邊界,找到自己的使用方式。

甚至,推動它變得更好。

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
庫里屈居第三!美媒曬NBA控衛(wèi)TOP25:保羅8歐文11威少12東契奇19

庫里屈居第三!美媒曬NBA控衛(wèi)TOP25:保羅8歐文11威少12東契奇19

鍋子籃球
2025-07-19 18:01:13
杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

火山詩話
2025-07-17 19:05:28
賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

奇思妙想生活家
2025-07-19 17:23:38
7月19日,多家上市公司發(fā)布重大利好利空好消息

7月19日,多家上市公司發(fā)布重大利好利空好消息

A股數(shù)據(jù)表
2025-07-19 05:30:03
名記:開拓者本想沖季后賽 現(xiàn)在卻為下賽季打不了的球員花4000萬

名記:開拓者本想沖季后賽 現(xiàn)在卻為下賽季打不了的球員花4000萬

直播吧
2025-07-19 13:48:07
俄專家:美國現(xiàn)在才發(fā)現(xiàn),中國是天然超級大國

俄專家:美國現(xiàn)在才發(fā)現(xiàn),中國是天然超級大國

星辰夜語
2025-07-18 21:44:14
廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

南方都市報
2025-07-19 12:16:59
90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

懸案解密檔案
2025-05-05 20:20:25
外媒:巴西對中國稀土出口量激增

外媒:巴西對中國稀土出口量激增

參考消息
2025-07-18 21:32:29
全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

生活新鮮市
2025-07-19 17:36:40
知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

葉公子
2025-07-17 11:23:24
下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

小影的娛樂
2025-07-19 10:30:00
預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內(nèi)僅此一地需驗資

預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內(nèi)僅此一地需驗資

板扎在線
2025-07-19 07:33:47
47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

懸案解密檔案
2025-07-18 15:54:04
林仲勛高調(diào)曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

林仲勛高調(diào)曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

永恒之誓
2025-07-19 11:05:08
敘利亞折騰到現(xiàn)在,朱拉尼應該明白了,擺在他面前只有兩條路可走

敘利亞折騰到現(xiàn)在,朱拉尼應該明白了,擺在他面前只有兩條路可走

董董歷史燴
2025-07-19 17:02:11
1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

柳絮憶史
2025-07-11 11:35:25
布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

田先生籃球
2025-07-19 15:01:41
要警惕時代的進程,歐美關閉當?shù)刂袊髽I(yè),成為一種潮流

要警惕時代的進程,歐美關閉當?shù)刂袊髽I(yè),成為一種潮流

藍色海邊
2025-07-19 09:29:39
中方動真格了!圍堵中國使館,中國正式發(fā)函韓國,李在明卻沉默了

中方動真格了!圍堵中國使館,中國正式發(fā)函韓國,李在明卻沉默了

格斗聯(lián)盟
2025-07-19 18:00:08
2025-07-19 18:55:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
5489文章數(shù) 26583關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內(nèi)職務

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內(nèi)職務

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂要聞

肖戰(zhàn)微博改名:去掉X玖少年團頭銜

財經(jīng)要聞

娃哈哈爭產(chǎn)大戰(zhàn):杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發(fā)布"汽車行車控制安全技術(shù)驗證VCTA"

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
旅游
藝術(shù)

房產(chǎn)要聞

漏水、開裂…為阻止降價,海口這個盤業(yè)主集體爆黑料,還講鬼故事!

呼吸科專家破解呼吸道九大謠言!

教育要聞

團體第一!全員金牌!中國隊重奪國際數(shù)學奧賽冠軍

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 台山市| 历史| 焉耆| 新昌县| 土默特左旗| 永寿县| 兰西县| 镇坪县| 旬阳县| 万宁市| 禹州市| 罗山县| 枣庄市| 大余县| 进贤县| 法库县| 汽车| 贡嘎县| 宣汉县| 普宁市| 汝州市| 东阳市| 南郑县| 遂溪县| 大城县| 洛浦县| 双牌县| 建德市| 广西| 炉霍县| 宁城县| 安塞县| 江津市| 阿拉善左旗| 新邵县| 龙江县| 曲靖市| 江西省| 田林县| 北辰区| 周口市|