99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

看似加速,實(shí)則拖慢:AI 寫代碼讓開發(fā)者效率倒退19%

0
分享至

大數(shù)據(jù)文摘出品

美國METR研究所完成了一項(xiàng)針對(duì)AI編程工具影響的實(shí)驗(yàn)研究。他們發(fā)現(xiàn),經(jīng)驗(yàn)豐富的開源開發(fā)者在使用AI編程工具時(shí),完成任務(wù)的時(shí)間平均增長了19%。


這與開發(fā)者自己的感知完全相反。畢竟,參與研究的開發(fā)者普遍都相信,AI將提升他們的效率。

在任務(wù)開始前,他們預(yù)測AI能讓自己提速24%。可現(xiàn)實(shí)數(shù)據(jù)冷冷地指出:AI讓他們“看似飛快,實(shí)則拖慢”。


圖注:當(dāng)研究參與者可以使用像 Cursor Pro 這樣的AI工具時(shí),任務(wù)實(shí)際上耗時(shí)增加了19%。

研究團(tuán)隊(duì)通過隨機(jī)對(duì)照實(shí)驗(yàn)(RCT),在真實(shí)環(huán)境中測試AI工具的使用效果。值得一提的是,這是目前公認(rèn)的衡量因果關(guān)系最嚴(yán)格的方法。

實(shí)驗(yàn)如何進(jìn)行?


圖注:實(shí)驗(yàn)設(shè)計(jì)。在分配條件前定義任務(wù),通過屏幕錄制驗(yàn)證執(zhí)行情況,并利用專家與開發(fā)者的預(yù)測衡量預(yù)期與實(shí)際結(jié)果的差距。

實(shí)驗(yàn)共追蹤了16名高級(jí)開發(fā)者,這些開發(fā)者在各自的開源項(xiàng)目中完成了246個(gè)實(shí)際任務(wù),任務(wù)涵蓋復(fù)雜模塊的開發(fā)與修復(fù),工作負(fù)載真實(shí)而具體。

每個(gè)任務(wù)被隨機(jī)分配到兩個(gè)組:一組使用AI工具,另一組不使用。

AI組開發(fā)者主要使用的是Cursor Pro,集成了Claude 3.5和Claude 3.7 Sonnet等主流大模型。

開發(fā)者在整個(gè)過程中錄屏,并記錄完成每個(gè)任務(wù)所花費(fèi)的時(shí)間。為了剔除任務(wù)難度差異的干擾,研究人員采用了統(tǒng)計(jì)方法,引入開發(fā)者對(duì)任務(wù)時(shí)間的預(yù)估值作為參考。

換句話說,他們不僅測量“花了多長時(shí)間”,還測量“比預(yù)期多了多少”。


最終結(jié)果顯示:AI用戶完成任務(wù)的平均用時(shí)比非AI用戶長出19%。

諷刺的是,哪怕在任務(wù)完成后,那些用過AI的開發(fā)者仍然堅(jiān)信,自己“節(jié)省了20%的時(shí)間”。

即便現(xiàn)實(shí)已經(jīng)反轉(zhuǎn),他們依然覺得自己在加速。

研究者指出,這種“快感錯(cuò)覺”可能來自AI協(xié)助下的新型流程分布。研究結(jié)果表明,AI并沒有真正提升核心產(chǎn)出環(huán)節(jié)的效率,只是重新分配了注意力和勞動(dòng)方式。

具體來說,當(dāng)AI工具被啟用后,開發(fā)者在“主動(dòng)編碼”上的時(shí)間反而減少了。

他們花了更多時(shí)間在提示設(shè)計(jì)、AI產(chǎn)出審查、等待響應(yīng)、閑置,以及理解生成內(nèi)容上。

研究顯示,開發(fā)者不是在寫代碼,而是在“與AI溝通如何寫代碼”。這種交互過程看起來很“充實(shí)”,但最終產(chǎn)出并不一定更快。


圖注:在使用AI的情況下,開發(fā)者減少了編碼和查找信息的時(shí)間,更多時(shí)間用于與AI交互和等待

對(duì)新項(xiàng)目或快速原型開發(fā),AI確實(shí)能提供幫助。但在面對(duì)成熟的大型項(xiàng)目,特別是開源社區(qū)中常見的、結(jié)構(gòu)復(fù)雜、規(guī)則隱含、質(zhì)量要求高的工程時(shí),AI反而成為新的負(fù)擔(dān)。

它需要大量的補(bǔ)充說明、更頻繁的審查,甚至還會(huì)引發(fā)語義誤解。

開發(fā)者不再是在解決問題,而是在解釋問題、矯正AI、并試圖相信AI有幫助。

此外,開發(fā)者的“心理節(jié)奏”也發(fā)生了變化。他們頻繁切換任務(wù):提示生成、回顧產(chǎn)出、人工修正、重復(fù)嘗試,這種流程非常碎片化。

當(dāng)一個(gè)人忙于各種小動(dòng)作時(shí),他自然會(huì)覺得自己很“快”。但數(shù)據(jù)不會(huì)說謊:他只是“動(dòng)了很多”,并沒有“前進(jìn)很遠(yuǎn)”。

還有哪些發(fā)現(xiàn)?

METR的研究不僅揭示了AI工具在實(shí)際工作中的真實(shí)效率,還對(duì)目前主流AI評(píng)估體系提出了質(zhì)疑。

他們指出,當(dāng)前業(yè)界廣泛采用的基準(zhǔn)測試,如SWE-Bench和RE-Bench,存在嚴(yán)重偏差。這些測試通常是人工設(shè)置的小型題目,情境孤立,完全不反映真實(shí)項(xiàng)目的復(fù)雜性。

開發(fā)者在其中只需解決一小段代碼問題,不用考慮上下文、不用和團(tuán)隊(duì)協(xié)作,也沒有歷史遺留負(fù)擔(dān)。

這種測試環(huán)境高度理想化,與開源項(xiàng)目、企業(yè)代碼庫、或大型框架開發(fā)的日常工作完全不同。

于是,我們就得到了一個(gè)錯(cuò)誤的結(jié)論:AI表現(xiàn)得非常強(qiáng)大。

而METR的隨機(jī)對(duì)照實(shí)驗(yàn),則是在現(xiàn)實(shí)中運(yùn)行、在項(xiàng)目中嵌入、在流程中測量。研究人員將AI直接部署到開發(fā)者的真實(shí)任務(wù)中,不干預(yù)流程,只記錄結(jié)果。

這是對(duì)“AI助力”的最直接檢驗(yàn)。

而且,這種實(shí)驗(yàn)還能揭示“感知偏差”:即人們?cè)谑褂肁I之后,對(duì)效果的主觀判斷如何偏離客觀現(xiàn)實(shí)。這才是真正有價(jià)值的測試方法。

所以,如果AI讓人“覺得自己更快”,卻“實(shí)際上更慢”,那么其價(jià)值評(píng)估將被全面高估。

企業(yè)、教育機(jī)構(gòu)、平臺(tái)服務(wù)商,乃至政策制定者,都可能被誤導(dǎo)。

研究還暗示,AI工具的價(jià)值可能不是“提高效率”,而是“改造流程”。它改變了工作的節(jié)奏、重構(gòu)了問題表達(dá)方式、干擾了注意力分配。

地址:https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf

作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢!

GPU 訓(xùn)練特惠!

H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開支30%以上!

掃碼了解詳情?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中美俄幡然醒悟!原來真正吸血的是歐洲人,如今他們終于要還債了

中美俄幡然醒悟!原來真正吸血的是歐洲人,如今他們終于要還債了

通文知史
2025-07-22 21:55:02
越深愛,越別扭,這三大星座太難懂

越深愛,越別扭,這三大星座太難懂

星座不求人
2025-07-23 21:10:11
國家隊(duì)暫停托市!7月24日,今日三大重要消息沖擊市場

國家隊(duì)暫停托市!7月24日,今日三大重要消息沖擊市場

風(fēng)口招財(cái)豬
2025-07-24 01:13:10
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
170萬觀眾打出9.7分,沒上映票房破6200萬,大鵬的冠軍保不住了?

170萬觀眾打出9.7分,沒上映票房破6200萬,大鵬的冠軍保不住了?

靠譜電影君
2025-07-22 23:32:19
工齡40年11個(gè)月,個(gè)人賬戶21.67萬,上海大爺拿了多少養(yǎng)老金呢?

工齡40年11個(gè)月,個(gè)人賬戶21.67萬,上海大爺拿了多少養(yǎng)老金呢?

養(yǎng)老規(guī)劃羅姐說
2025-07-22 19:03:14
最傷害 “陰道” 的 4 個(gè)行為,還在經(jīng)常做的,看完要注意了

最傷害 “陰道” 的 4 個(gè)行為,還在經(jīng)常做的,看完要注意了

伊人河畔
2025-07-12 10:13:49
福建廳干游祖煙履新

福建廳干游祖煙履新

魯中晨報(bào)
2025-07-22 07:52:08
48歲陶紅因病去世,9歲女兒一路跪拜祈福,與樂嘉婚姻僅維系3年……

48歲陶紅因病去世,9歲女兒一路跪拜祈福,與樂嘉婚姻僅維系3年……

不二大叔
2025-07-15 21:45:47
為驗(yàn)證祖先是中國人,6名南島語族后人駕獨(dú)木舟,航行116天來中國

為驗(yàn)證祖先是中國人,6名南島語族后人駕獨(dú)木舟,航行116天來中國

博覽歷史
2025-07-22 15:20:03
谷歌母公司二季度業(yè)績超預(yù)期,提高全年資本支出至850億美元,盤后一度漲3.4% | 財(cái)報(bào)見聞

谷歌母公司二季度業(yè)績超預(yù)期,提高全年資本支出至850億美元,盤后一度漲3.4% | 財(cái)報(bào)見聞

華爾街見聞官方
2025-07-24 05:42:19
女籃眾將發(fā)文告別!4朝元老有意宣退,王思雨晚上發(fā)文不甘心

女籃眾將發(fā)文告別!4朝元老有意宣退,王思雨晚上發(fā)文不甘心

凡知
2025-07-23 16:09:34
發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長壽的老人,幾乎都是子女用生命在托舉

發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
記者:劉誠宇可能不具備踢點(diǎn)球的大心臟,鎮(zhèn)定、決斷都還有待提高

記者:劉誠宇可能不具備踢點(diǎn)球的大心臟,鎮(zhèn)定、決斷都還有待提高

直播吧
2025-07-23 22:29:22
南京德基廣場偶遇鹿晗,本人個(gè)子不高好瘦小,白皮紅發(fā)漫畫感十足

南京德基廣場偶遇鹿晗,本人個(gè)子不高好瘦小,白皮紅發(fā)漫畫感十足

喜歡歷史的阿繁
2025-07-23 18:08:41
3年1.6億,恭喜湖人,交易非常成功,詹姆斯該開心了

3年1.6億,恭喜湖人,交易非常成功,詹姆斯該開心了

青山隱隱啊
2025-07-23 10:33:05
云南高校在云南遇冷:農(nóng)大缺額152人、師大缺72人、昆工缺69人!

云南高校在云南遇冷:農(nóng)大缺額152人、師大缺72人、昆工缺69人!

凱旋學(xué)長
2025-07-23 21:52:37
女籃逆襲殺進(jìn)世大運(yùn)決賽!李筍南完爆宮魯鳴:中國隊(duì)主帥該試試他

女籃逆襲殺進(jìn)世大運(yùn)決賽!李筍南完爆宮魯鳴:中國隊(duì)主帥該試試他

籃球快餐車
2025-07-24 05:16:28
高喊“打倒民營經(jīng)濟(jì)”的是他,高喊“支持民營經(jīng)濟(jì)”的還是他

高喊“打倒民營經(jīng)濟(jì)”的是他,高喊“支持民營經(jīng)濟(jì)”的還是他

深度報(bào)
2025-07-12 23:26:48
巴西巨星太瀟灑,約三女海邊度假,與皇馬續(xù)約談判已宣告破裂!

巴西巨星太瀟灑,約三女海邊度假,與皇馬續(xù)約談判已宣告破裂!

綠茵舞著
2025-07-24 00:14:40
2025-07-24 06:31:00
大數(shù)據(jù)文摘 incentive-icons
大數(shù)據(jù)文摘
專注大數(shù)據(jù),每日有分享!
6707文章數(shù) 94446關(guān)注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

宗馥莉被質(zhì)疑讀的是“野雞大學(xué)” 校方回應(yīng)

頭條要聞

宗馥莉被質(zhì)疑讀的是“野雞大學(xué)” 校方回應(yīng)

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財(cái)經(jīng)要聞

律師解析娃哈哈遺產(chǎn)案:遺囑是最大變數(shù)

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態(tài)度原創(chuàng)

健康
教育
游戲
旅游
數(shù)碼

呼吸科專家破解呼吸道九大謠言!

教育要聞

光宗耀祖!女生收到錄取通知書,送的不是快遞員,而是兩位飛行員

《光環(huán)無限》美術(shù)組曾用辭職"逼宮":要求用虛幻引擎

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數(shù)碼要聞

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項(xiàng)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 永嘉县| 原阳县| 聊城市| 彭阳县| 深泽县| 三门县| 许昌县| 县级市| 三穗县| 丰都县| 武定县| 仁化县| 周至县| 双流县| 黎川县| 汕头市| 衡阳市| 莱阳市| 星子县| 巴林右旗| 双辽市| 滦平县| 翼城县| 彩票| 班玛县| 贡觉县| 十堰市| 临江市| 望谟县| 神农架林区| 筠连县| 济阳县| 藁城市| 晴隆县| 新河县| 永靖县| 滕州市| 清水县| 丽水市| 新蔡县| 和平区|