99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek團隊再放大招:代碼竟然能解鎖AI通用推理能力

0
分享至



代碼竟成AI推理“新寵”?DeepSeek團隊提出CodeI/O方法:另辟蹊徑,解鎖通用AI推理能力!

大家有沒有感覺,AI在某些“窄技能”上表現驚艷,比如做數學題、寫代碼,但在更廣泛的推理任務上,就有點力不從心了?就像咱平時說的,有點“偏科”啊!

這是為啥呢?研究人員發現,問題就出在訓練數據上!像數學、代碼生成這種任務,數據管夠,模型學得就好。但像邏輯推理、科學推斷、符號推理這些更通用的推理任務,訓練數據就稀少且碎片化,模型自然就“吃不飽”

那咋辦呢?難道通用AI推理能力提升就卡在這兒了?

來自DeepSeek團隊的大神們最近發表了一篇論文,提出了一種名為CodeI/O的新方法,簡直是另辟蹊徑,讓人眼前一亮!


我們一起來扒一扒這篇論文

CodeI/O 的核心思想簡單來說就是:把代碼變成AI推理的“養料”!

你可能會問,代碼和推理有啥關系? 關系可大了!

研究人員發現,真實世界的代碼程序,其實蘊含著豐富的推理模式! 想想我們寫代碼的過程:

  • ?邏輯流程規劃:先想好程序的大框架,一步步實現功能

  • ?狀態空間搜索:調試bug,嘗試不同的解決方案

  • ?決策樹遍歷:if-else,各種條件判斷

  • ?模塊化分解:把復雜問題拆成小模塊,逐個擊破

這些不都是 通用的推理能力嗎? 只不過,這些推理模式隱藏在代碼的語法和細節之中,之前的AI模型很難直接學到

CodeI/O 的巧妙之處就在于,它把原始代碼轉化成了一種 “代碼輸入-輸出預測” 的格式。 就像下面這樣:

  • ?輸入:一段代碼 (函數) + 測試用例的輸入

  • ?輸出:這段代碼在給定輸入下的執行結果 (輸出)

更絕的是,CodeI/O 還要求模型用 自然語言的 “思維鏈 (Chain-of-Thought, CoT)” 來預測這個輸入和輸出! 這就像讓模型用人類的語言,一步步解釋代碼的推理過程


這樣做有啥好處呢?

  1. 1.提取通用推理模式: 通過預測代碼的輸入輸出,并用CoT解釋,模型就能學到代碼中蘊含的通用推理“原語”,比如邏輯流程、狀態搜索等等,而且 擺脫了代碼語法的束縛

  2. 2.數據豐富且可擴展: 代碼資源遍地都是!CodeI/O 可以從各種代碼庫中大規模收集數據,而且很容易生成新的輸入-輸出對,訓練數據管夠!

  3. 3.保真且可驗證: 代碼是可以執行的!我們可以 驗證模型的預測是否正確 ,甚至可以讓模型進行多輪修正 (CodeI/O++),進一步提升推理能力

實驗效果如何呢?

研究人員在14個不同的推理 benchmark上進行了測試,包括符號推理、科學推理、邏輯推理、數學推理、常識推理等等。 結果令人驚喜!

  • ?效果全面提升: CodeI/O 在各種推理任務上都取得了一致的提升,不像其他方法可能只在特定任務上有效

  • ?超越強大基線: 即使和一些現有的優秀數據集 (如OpenMathInstruct2, OpenCoder-SFT-Stage1, WebInstruct) 相比,CodeI/O 也更勝一籌

  • ?模型能力更均衡: CodeI/O 不會像某些方法那樣,只提升模型在少數任務上的表現,反而導致其他任務下降,而是全面均衡地提升模型的推理能力


CodeI/O 就像是給AI模型找到了一種新的“學習方法”:

  • ?不刷題,改“讀代碼”: 從海量代碼中學習通用的推理模式,而不是死記硬背題目的答案

  • ?從“術”到“道”: 擺脫代碼語法的束縛,學習更本質的推理“原語”

  • ?數據自給自足: 代碼數據取之不盡,用之不竭,訓練數據不再是瓶頸

參考:

https://arxiv.org/pdf/2502.07316

?星標AI寒武紀,好內容不錯過?

用你的在看告訴我~

求贊

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
湖南前院長跳樓自殺第4天,兒子哭訴真實死因,惡心的一幕出現了

湖南前院長跳樓自殺第4天,兒子哭訴真實死因,惡心的一幕出現了

聯友說娛
2025-06-23 16:24:59
島內民調顯示:94%網友將投“不同意罷免”

島內民調顯示:94%網友將投“不同意罷免”

參考消息
2025-06-23 11:45:25
特朗普:如果他說了核武器,說了哪國向伊朗提供核彈,請通知我

特朗普:如果他說了核武器,說了哪國向伊朗提供核彈,請通知我

昨夜軍帖
2025-06-24 07:19:15
馬科斯:菲律賓不會屈服,如果中國采取行動,菲律賓不惜發動戰爭

馬科斯:菲律賓不會屈服,如果中國采取行動,菲律賓不惜發動戰爭

三分亮劍
2025-06-23 22:29:23
中國艾滋病人數達132.9萬!攜帶患者難以辨認,建議遠離這三種人

中國艾滋病人數達132.9萬!攜帶患者難以辨認,建議遠離這三種人

紀中百大事
2025-06-23 08:35:03
特朗普一炸,中伊3萬億投資血本無歸?中國早已預料到了這一天

特朗普一炸,中伊3萬億投資血本無歸?中國早已預料到了這一天

科技虎虎
2025-06-24 10:17:30
急了!張雪峰連續發文提醒考生,強調三遍,不要看分排名更重要

急了!張雪峰連續發文提醒考生,強調三遍,不要看分排名更重要

戶外阿毽
2025-06-24 01:39:43
張籽萱橫空出世,震驚各國媒體!中國女排已無需再召回丁霞刁琳宇

張籽萱橫空出世,震驚各國媒體!中國女排已無需再召回丁霞刁琳宇

金毛愛女排
2025-06-24 00:00:09
文胖:杜蘭特不斷拒絕其他交易方案,直到報價低到火箭無法拒絕的地步

文胖:杜蘭特不斷拒絕其他交易方案,直到報價低到火箭無法拒絕的地步

雷速體育
2025-06-24 09:21:25
可笑不?明明是她的成就,人民日報的標題里卻沒有她的姓名

可笑不?明明是她的成就,人民日報的標題里卻沒有她的姓名

娛樂故事
2025-06-22 12:11:43
廣東隊麻煩大了!官方通報重大違規,杜鋒恐受牽連,CBA要重罰

廣東隊麻煩大了!官方通報重大違規,杜鋒恐受牽連,CBA要重罰

宗介說體育
2025-06-24 11:39:53
全球90%都是日本生產,若斷供中國如何應對?別國為何無法生產?

全球90%都是日本生產,若斷供中國如何應對?別國為何無法生產?

答案在這兒
2025-06-23 14:01:26
6月24日,養老金調整通知下周發布?月入3500元能補發700元嗎?

6月24日,養老金調整通知下周發布?月入3500元能補發700元嗎?

王五說說看
2025-06-24 09:13:44
美國果然對中國動手了:轟炸伊朗,打從一開始就是針對中國的圈套

美國果然對中國動手了:轟炸伊朗,打從一開始就是針對中國的圈套

時光琉影8
2025-06-23 18:07:26
必須嚴懲!重慶動物園3女1男圍毆勸人者,打人者家族企業被扒

必須嚴懲!重慶動物園3女1男圍毆勸人者,打人者家族企業被扒

不寫散文詩
2025-06-24 01:42:28
尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

星宇共鳴
2025-05-21 17:58:05
兩岸統一喜訊!沒等我軍出手,關鍵時刻,大陸收到一份“大禮”

兩岸統一喜訊!沒等我軍出手,關鍵時刻,大陸收到一份“大禮”

熒惑手心
2025-06-23 09:09:28
拒絕投資“領導宣傳片”,四川功勛警察被捕

拒絕投資“領導宣傳片”,四川功勛警察被捕

有戲
2025-06-23 15:12:31
想不到!大名鼎鼎的安慶五星級大酒店,淪落到在外擺攤做外賣了…

想不到!大名鼎鼎的安慶五星級大酒店,淪落到在外擺攤做外賣了…

火山詩話
2025-06-24 09:36:16
“滿門被裁”,一家四口僅剩老媽還有工作了

“滿門被裁”,一家四口僅剩老媽還有工作了

螞蟻大喇叭
2025-06-22 19:05:41
2025-06-24 14:51:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
731文章數 320關注度
往期回顧 全部

科技要聞

特斯拉股價飆漲8%,但Robotaxi小違章不斷

頭條要聞

外媒:內塔尼亞胡宣布與伊朗達成全面停火協議

頭條要聞

外媒:內塔尼亞胡宣布與伊朗達成全面停火協議

體育要聞

如果你喜歡籃球,你沒理由不喜歡步行者

娛樂要聞

名校不是護身符,李雪琴更多黑料被扒

財經要聞

以色列和伊朗同意全面停火!

汽車要聞

7.98萬起 firefly螢火蟲推出電池租用購車方案

態度原創

本地
數碼
手機
藝術
軍事航空

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

數碼要聞

高到沒人敢信!曝AMD Zen6 CPU頻率將遠超6.0GHz

手機要聞

卷出手機電池新高度:榮耀 MTN-AN00 / AN80 曝光,額定 8100mAh

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

特朗普:以伊完全同意全面停火

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 云阳县| 玉环县| 札达县| 温宿县| 布尔津县| 福安市| 舞钢市| 安宁市| 通山县| 华坪县| 龙山县| 辉南县| 鄂托克旗| 新密市| 鸡东县| 衢州市| 罗江县| 游戏| 四子王旗| 扎赉特旗| 太谷县| 台南县| 团风县| 静乐县| 内丘县| 南川市| 鲁甸县| 南靖县| 肥东县| 东阿县| 河南省| 鹤岗市| 彭阳县| 休宁县| 宾阳县| 无锡市| 永清县| 浮梁县| 宁安市| 岳西县| 广安市|