99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

三個大模型合作,1000次迭代,竟能像人類科學家一樣發現方程

0
分享至


來源:機器之心

隨著AI4Science的浪潮席卷科研各領域,如何將強大的人工智能模型真正用于分析科學數據、構建數學模型、發現科學規律,正成為該領域亟待突破的關鍵問題。

近日,中國科學院自動化研究所的研究人員提出了一種創新性框架 ——DrSR (Dual Reasoning Symbolic Regression):通過數據分析與經驗歸納 “雙輪驅動”,賦予大模型像科學家一樣 “分析數據、反思成敗、優化模型” 的能力。

在 DrSR 中,三位 “虛擬科學家” 協同工作:

  • 一個善于洞察變量關系的 “數據科學家”;

  • 一個擅長總結失敗教訓與成功經驗的 “理論科學家”;

  • 一個勇于嘗試假設、不斷優化模型的 “實驗科學家”。

這三種角色基于大模型構建起高效的協作機制,共同驅動 DrSR 實現智能化、系統化的科學方程發現。

在物理、生物、化學、材料等跨學科領域的典型建模任務中(如非線性振蕩系統建模、微生物生長速率建模、化學反應動力學建模、材料應力 - 應變關系建模等),DrSR 展現出強大的泛化能力,刷新當前最優性能,成為 AI 助力科學研究的有力工具。


  • 論文地址:https://arxiv.org/abs/2506.04282

  • 論文標題:DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience

研究背景

在科學發現和工程建模中,尋找數據背后的數學模型一直是一項核心任務。這正是符號回歸(Symbolic Regression, SR)的目標 ——從觀測數據出發,自動生成解釋性強、結構清晰的數學方程。

這種 “從數據中還原規律” 的能力,已在物理、化學、生物、材料等多個學科中發揮了巨大作用,成為人類理解復雜系統的重要工具。

隨著大模型的興起,符號回歸正邁入一個 “類人推理” 的新階段。例如,LLM-SR 等方法開始嘗試用大模型直接生成公式骨架(skeleton),再配合優化器擬合參數,實現 “從提示詞到方程” 的自動生成。這讓符號回歸從傳統的遺傳進化算法中解放出來,性能和表達能力雙雙提升。

但問題也隨之而來,這些方法雖然 “公式寫得快”,卻往往 “不看數據”,更 “不記經驗”。

模型生成公式靠的是大模型內嵌的科學知識,而非對當前實驗數據的深入理解。

一旦某個公式生成失敗,模型通常無法從失敗中改進策略,只會機械地重復嘗試,陷入 “盲猜” 或 “重走老路” 的困境。

結果就是:不是過擬合 “已有套路”,就是反復生成無效表達式,計算資源浪費嚴重,智能化程度受限。

為了解決這一難題,研究團隊提出了全新框架 DrSR:讓模型 “會看題”“會復盤”“會改進”—— 像科學家一樣,從數據中洞察結構、從失敗中總結經驗、在生成中持續進化。

DrSR:讓大模型 “有據可依、

步步為營” 地發現規律

DrSR 的核心理念是 “雙路徑推理”(Dual Reasoning):通過引入 “數據洞察” 與 “經驗總結” 兩條信息流,為大模型提供結構引導與策略反饋,讓其像科學家一樣高效、穩健地進行探索。

DrSR 的兩大關鍵機制包括:

  • 數據驅動的洞察生成(Data-aware Insight Extraction)

  • 經驗驅動的策略總結(Inductive Idea Learning)

DrSR 的流程并不復雜,關鍵在于:讓 LLM 在每一輪嘗試中都 “看數據、學經驗、再出手”,具體流程如圖 1 所示。



圖 1:DrSR 的雙路徑推理機制,讓 LLM 在分析、生成、復盤三個環節協同工作,模擬科學家的研究思維

模塊 a:從數據中提煉結構線索

  • 數據分析模塊由一個 “結構洞察型 LLM” 構成,它負責分析輸入輸出變量之間的映射關系,提取變量之間的耦合程度、單調性、線性 / 非線性趨勢等結構特征。

  • DrSR 不只分析原始數據,還會根據上一輪候選方程的殘差,進一步定位 “沒擬合好” 的數據段,為后續方程生成提供更高質量的提示。

模塊 b:從歷史結果中總結成功經驗

方程一旦生成,DrSR 不僅會進行擬合與打分,還會將結果分類為「效果更好」「效果變差」「無法執行」三類,并交由一個 “經驗型 LLM” 進行分析,總結出可以重復利用的經驗知識。

該模塊會進行如下反思:

  • 為什么這條方程效果更好 / 更壞 / 無法執行?

  • 從這次方程的生成中,可以總結出什么經驗或教訓?

總結出的知識以 idea 的形式存入 idea 庫(Idea Library),供后續輪次調用,提升生成策略的有效性。

模塊 c:方程生成 + 數值擬合

DrSR 的 “主控型 LLM” 負責綜合問題描述、數據分析結論和 idea 庫的經驗,生成方程 skeleton。隨后調用 BFGS 等優化器進行系數擬合,并評估方程的整體誤差。表達式被送回評估路徑,進入下一輪經驗提煉與數據再分析循環。

這個模塊是整個 DrSR 的 “前臺”,而 a 與 b 是強大的 “后端支持”。

總結來說,DrSR 的運行流程是一種閉環:

數據分析 → 提示引導 → 方程生成 → 評估打分 → 經驗總結,如此循環。每一次生成,模型都在積累知識、修正路徑,從 “盲目試探” 走向 “有的放矢”。

實驗結果:DrSR 不僅 “更準”,

還 “更快、更穩、更聰明”

研究團隊在六大符號回歸基準任務上系統評估了 DrSR 的性能,涵蓋物理、生物、化學、材料等多個科學領域,結果顯示 DrSR 全面超越現有主流方法,不僅準確率更高,而且在推理效率和泛化能力上也顯著領先。

全面領先的擬合精度與準確率



表 1. DrSR 和基線方法在六個符號回歸基準上的總體性能

如表 1 所示,平均來看,DrSR 在 6 個任務中有 5 個取得了最高準確率(Acc)和最低歸一化均方誤差(NMSE)。特別地,DrSR 在非線性阻尼振蕩系統建模任務(Oscillation 2)上達成了近乎完美的 99.94% 準確率,誤差低至 1.8e-12,顯著優于所有基線方法。

快速收斂:從一開始就更聰明



圖 2. 訓練收斂性比較

從圖 2 可以看到,DrSR 在幾乎所有數據集上都以更快速度達到更低的誤差。在初期迭代階段,其誤差下降趨勢也更穩定,不容易陷入振蕩或卡頓,這說明 DrSR 的雙推理策略能更有效引導方程生成方向,從而減少無效嘗試次數。

? 有效率更高:生成的方程更 “靠譜”



圖 3. 有效解比例對比

如圖 3 所示,DrSR 生成的方程在語法、編譯、可求值等方面的有效比例普遍高于 LLM-SR 約 10%-20%,這背后正是 “經驗學習” 機制的作用 —— 模型逐步避開常見失敗結構。

泛化更強,且對噪聲和 OOD 更魯棒



圖 4. 在 ID 和 OOD 數據下跨科學領域的泛化對比

圖 4 展示了 DrSR 在 ID(域內)與 OOD(域外)數據下的性能對比。可以看到:在所有任務、所有設置下,DrSR 的歸一化均方誤差(NMSE)始終是最低的,展現出極強的模型穩定性。其他方法(如 PySR 或 uDSR)雖然在部分任務中 ID 表現尚可,但面對 OOD 分布時誤差陡升、性能驟降,而 DrSR 則表現出了 “跨場景保持魯棒” 的能力。



表 2. 不同高斯噪聲水平下的性能比較

如表 2 所示,在不同高斯噪聲水平下,DrSR 均顯著優于 LLM-SR,展現出抗噪、抗漂移的泛化優勢。

消融實驗:兩個核心機制 “缺一不可”



圖 5. 消融實驗

圖 5 的消融實驗也驗證了兩個核心機制的重要性:沒有結構引導,模型不知從何生成;沒有經驗總結,模型容易反復試錯。DrSR 的成功,正是這兩者閉環協同的結果。

案例展示:DrSR 如何一步步逼近 “真實方程”

為了更直觀地展示 DrSR 的 “類科學家” 建模過程,研究團隊以非線性阻尼振蕩系統建模任務為例,繪制了其在 1000 次迭代過程中的方程演化軌跡,如圖 6 所示。



圖 6. DrSR 的性能軌跡與代表性表達式演化,每一個臺階,都是模型一次深刻的 “認知飛躍”

該任務的真實方程為:

DrSR 在僅 1000 輪迭代后生成的最優方程為:

基線 LLM-SR 在 2000 輪迭代后生成的最優方程為:

可以看到:DrSR 用一半的迭代次數,就生成了更接近真實結構的表達式,充分體現其 “有方向感” 的探索能力。

這一案例也展現出 DrSR 獨特的三大智能行為:

  • 初期:大膽探索,快速淘汰

在前幾十輪中,DrSR 嘗試了一系列初步構造的方程,例如僅包含多項式組合的表達式(如 -0.5xv - 0.04x2 - 0.24v2 等),盡管形式接近,但精度仍遠未達到理想值。此階段模型更像一個 “實驗科學家”,快速試錯、積累經驗。

  • 中期:融合非線性成分,跨越式發展

隨著經驗的積累與數據結構的洞察引入,DrSR 開始生成帶有 sin (x)、x2v 等非線性物理元素的表達式,方程擬合誤差明顯下降近兩個數量級,說明模型已開始理解系統的振蕩性本質。此時,它如同一個 “理論科學家”,開始用正確的符號結構組織規律。

  • 后期:精煉組合,逼近真實動力學

最終,DrSR 提出了形如 0.8sin (x) - 0.5xv - 0.5v3 - 0.2x3 的復雜但精確表達式,誤差降至 10^-5 級別,接近人類解析解。這一過程高度模擬了科學發現中的 “假設 - 驗證 - 歸納” 的迭代式建模模式。

這個案例生動說明了 DrSR 如何結合 “結構洞察 + 經驗引導” 兩種智慧,逐步收斂到準確又可解釋的科學方程。

總結:讓大模型更像科學家,科學智能邁出關鍵一步

DrSR 提出了一種融合數據感知與經驗反思的符號回歸新范式,它通過結構洞察指導生成方向,通過經驗總結提升推理質量,讓大模型在科學建模中逐步具備 “看數據、記教訓、會修正” 的能力。

在多個跨學科的符號回歸任務中,DrSR 實現了對傳統方法與現有 LLM 基線的全方位超越,在準確率、收斂速度、方程有效性和泛化能力等維度表現突出。作為一套通用性強、可解釋性好、建模效率高的新架構,DrSR 為人工智能深度參與科學發現提供了堅實技術支撐。

DrSR 已集成至一站式智能科研平臺 ScienceOne,為科研工作者提供高效、可解釋的科學建模服務。值得強調的是,DrSR 并不依賴特定的大模型,具備良好的模型兼容性和可擴展性。未來,研究團隊將基于平臺自研的科學基礎大模型 S1-Base,進一步增強 DrSR 在科學建模中的推理能力與跨任務泛化能力。

局限與展望

盡管 DrSR 展現出優異的建模性能與類科學家的推理能力,但仍存在若干值得改進的方面:

  • 輸出波動:由于大模型生成本身具有隨機性,部分方程可能存在結構冗余、表達復雜等問題,仍需人工后處理或規則約束。

  • 模態輸入有限:DrSR 目前主要面向結構化數值數據,尚未支持圖像、圖表等更豐富的科學輸入形式,制約了其多模態建模能力。

這些問題正是未來演進的關鍵方向。研究團隊計劃繼續擴展 DrSR 至多模態科學建模場景,引入持續學習機制,提升策略泛化能力,逐步構建一個具備長期認知積累、適應科學復雜性的智能建模引擎。

讓人工智能不僅能 “擬合數據”,更能 “發掘自然規律”,這正是 AI4Science 走向深層科學智能的必由之路。

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
泰柬問題升溫,中國重炮回應,南部邊境紅線絕不允許任何人觸碰!

泰柬問題升溫,中國重炮回應,南部邊境紅線絕不允許任何人觸碰!

林子說事
2025-07-25 19:26:25
原外交副部長周南:香港回歸前,英國每年從香港拿走上千億人民幣

原外交副部長周南:香港回歸前,英國每年從香港拿走上千億人民幣

歷史縱觀
2025-07-24 22:12:19
0-2!王欣瑜無緣決賽,輸球原因曝光,主辦方做法遭質疑,不公平

0-2!王欣瑜無緣決賽,輸球原因曝光,主辦方做法遭質疑,不公平

侃球熊弟
2025-07-25 23:44:26
知名湘菜品牌被曝拖欠千萬元貨款!品牌方獨家回應

知名湘菜品牌被曝拖欠千萬元貨款!品牌方獨家回應

藍鯨新聞
2025-07-25 16:03:22
36款熱門車高危智駕場景測試,“團滅”!

36款熱門車高危智駕場景測試,“團滅”!

第一財經資訊
2025-07-25 13:35:25
國家出手6位首富被抓!有些已入外籍,原因曝光,早該迎來這一天

國家出手6位首富被抓!有些已入外籍,原因曝光,早該迎來這一天

阿傖說事
2025-07-19 07:50:26
施幼珍:不哭不鬧不上吊,拿捏死宗慶后僅用一招,她才是真正王者

施幼珍:不哭不鬧不上吊,拿捏死宗慶后僅用一招,她才是真正王者

普覽
2025-07-17 19:04:48
考生稱被“廈大馬來分校”誤錄取,考609分最后選擇復讀

考生稱被“廈大馬來分?!闭`錄取,考609分最后選擇復讀

大象新聞
2025-07-24 20:01:22
涉嫌嚴重違紀違法!惠州市委社會工作部副部長葉思南被查

涉嫌嚴重違紀違法!惠州市委社會工作部副部長葉思南被查

南方都市報
2025-07-25 14:44:29
微信轉賬時,出現這四個字,一定要停止轉款,即便是熟人也不行

微信轉賬時,出現這四個字,一定要停止轉款,即便是熟人也不行

農村情感故事
2025-07-16 13:33:48
克林頓:我一生有兩件事感到很遺憾,一中國加入WTO,二我做錯了

克林頓:我一生有兩件事感到很遺憾,一中國加入WTO,二我做錯了

趣文說娛
2025-07-24 17:22:53
布蘭科:如果沒有拉瑪西亞,巴薩可能已經垮掉了

布蘭科:如果沒有拉瑪西亞,巴薩可能已經垮掉了

懂球帝
2025-07-26 00:55:07
馬被拴在巨石50多天,啃光腳下的草,被救后它眼里流出來淚水

馬被拴在巨石50多天,啃光腳下的草,被救后它眼里流出來淚水

雪靈谷
2025-07-24 10:58:07
8年前,那個卷走父親全部300萬積蓄到國外揮霍的18歲女孩,咋樣了

8年前,那個卷走父親全部300萬積蓄到國外揮霍的18歲女孩,咋樣了

趣談人物紀
2025-07-23 12:00:03
理想i8亮相首周激戰樂道L90:線上爭到線下,用戶群體涇渭分明

理想i8亮相首周激戰樂道L90:線上爭到線下,用戶群體涇渭分明

駕仕派
2025-07-23 13:35:15
火箭欲再簽強援!3屆東部全明星聯手杜蘭特,休城沖擊總冠軍

火箭欲再簽強援!3屆東部全明星聯手杜蘭特,休城沖擊總冠軍

埃文凱爾
2025-07-26 00:34:47
陪練為主!廣東2米26小將連續2戰遭棄用 郭士強或另有安排

陪練為主!廣東2米26小將連續2戰遭棄用 郭士強或另有安排

狼叔評論
2025-07-26 00:13:10
開心!中超第18輪央視又直播北京國安比賽了 大愛塞蒂恩傳控足球

開心!中超第18輪央視又直播北京國安比賽了 大愛塞蒂恩傳控足球

80后體育大蜀黍
2025-07-25 23:55:26
丟人!郭士強關系戶全場3中0,運動戰0分,球迷:趕緊把他裁了

丟人!郭士強關系戶全場3中0,運動戰0分,球迷:趕緊把他裁了

南海浪花
2025-07-25 08:29:37
大鬧北京地鐵大媽社死!辱華罵人太囂張,直言美國更好,正臉曝光

大鬧北京地鐵大媽社死!辱華罵人太囂張,直言美國更好,正臉曝光

奧字侃娛
2025-07-24 15:30:13
2025-07-26 01:51:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4046文章數 37238關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

親子
游戲
健康
教育
旅游

親子要聞

小宸哥歷險記之門外有人:不要給陌生人開門

《無主之地4》已開發完畢進廠壓盤

呼吸科專家破解呼吸道九大謠言!

教育要聞

再獲國際物理奧賽金牌,南師附中學子勇登世界之巔!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 时尚| 安康市| 昌图县| 临颍县| 镇赉县| 石棉县| 巴东县| 霍州市| 赣州市| 江都市| 赤壁市| 措美县| 嘉义市| 于都县| 颍上县| 永靖县| 神木县| 阜平县| 灵川县| 台中市| 建平县| 苏州市| 家居| 营山县| 札达县| 景宁| 普定县| 饶平县| 罗山县| 永修县| 肥城市| 黄浦区| 鹿泉市| 新和县| 府谷县| 修武县| 慈溪市| 石柱| 光泽县| 江达县| 崇阳县|