來源:機器之心
隨著AI4Science的浪潮席卷科研各領域,如何將強大的人工智能模型真正用于分析科學數據、構建數學模型、發現科學規律,正成為該領域亟待突破的關鍵問題。
近日,中國科學院自動化研究所的研究人員提出了一種創新性框架 ——DrSR (Dual Reasoning Symbolic Regression):通過數據分析與經驗歸納 “雙輪驅動”,賦予大模型像科學家一樣 “分析數據、反思成敗、優化模型” 的能力。
在 DrSR 中,三位 “虛擬科學家” 協同工作:
一個善于洞察變量關系的 “數據科學家”;
一個擅長總結失敗教訓與成功經驗的 “理論科學家”;
一個勇于嘗試假設、不斷優化模型的 “實驗科學家”。
這三種角色基于大模型構建起高效的協作機制,共同驅動 DrSR 實現智能化、系統化的科學方程發現。
在物理、生物、化學、材料等跨學科領域的典型建模任務中(如非線性振蕩系統建模、微生物生長速率建模、化學反應動力學建模、材料應力 - 應變關系建模等),DrSR 展現出強大的泛化能力,刷新當前最優性能,成為 AI 助力科學研究的有力工具。
論文地址:https://arxiv.org/abs/2506.04282
論文標題:DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience
研究背景
在科學發現和工程建模中,尋找數據背后的數學模型一直是一項核心任務。這正是符號回歸(Symbolic Regression, SR)的目標 ——從觀測數據出發,自動生成解釋性強、結構清晰的數學方程。
這種 “從數據中還原規律” 的能力,已在物理、化學、生物、材料等多個學科中發揮了巨大作用,成為人類理解復雜系統的重要工具。
隨著大模型的興起,符號回歸正邁入一個 “類人推理” 的新階段。例如,LLM-SR 等方法開始嘗試用大模型直接生成公式骨架(skeleton),再配合優化器擬合參數,實現 “從提示詞到方程” 的自動生成。這讓符號回歸從傳統的遺傳進化算法中解放出來,性能和表達能力雙雙提升。
但問題也隨之而來,這些方法雖然 “公式寫得快”,卻往往 “不看數據”,更 “不記經驗”。
模型生成公式靠的是大模型內嵌的科學知識,而非對當前實驗數據的深入理解。
一旦某個公式生成失敗,模型通常無法從失敗中改進策略,只會機械地重復嘗試,陷入 “盲猜” 或 “重走老路” 的困境。
結果就是:不是過擬合 “已有套路”,就是反復生成無效表達式,計算資源浪費嚴重,智能化程度受限。
為了解決這一難題,研究團隊提出了全新框架 DrSR:讓模型 “會看題”“會復盤”“會改進”—— 像科學家一樣,從數據中洞察結構、從失敗中總結經驗、在生成中持續進化。
DrSR:讓大模型 “有據可依、
步步為營” 地發現規律
DrSR 的核心理念是 “雙路徑推理”(Dual Reasoning):通過引入 “數據洞察” 與 “經驗總結” 兩條信息流,為大模型提供結構引導與策略反饋,讓其像科學家一樣高效、穩健地進行探索。
DrSR 的兩大關鍵機制包括:
數據驅動的洞察生成(Data-aware Insight Extraction)
經驗驅動的策略總結(Inductive Idea Learning)
DrSR 的流程并不復雜,關鍵在于:讓 LLM 在每一輪嘗試中都 “看數據、學經驗、再出手”,具體流程如圖 1 所示。
圖 1:DrSR 的雙路徑推理機制,讓 LLM 在分析、生成、復盤三個環節協同工作,模擬科學家的研究思維
模塊 a:從數據中提煉結構線索
數據分析模塊由一個 “結構洞察型 LLM” 構成,它負責分析輸入輸出變量之間的映射關系,提取變量之間的耦合程度、單調性、線性 / 非線性趨勢等結構特征。
DrSR 不只分析原始數據,還會根據上一輪候選方程的殘差,進一步定位 “沒擬合好” 的數據段,為后續方程生成提供更高質量的提示。
模塊 b:從歷史結果中總結成功經驗
方程一旦生成,DrSR 不僅會進行擬合與打分,還會將結果分類為「效果更好」「效果變差」「無法執行」三類,并交由一個 “經驗型 LLM” 進行分析,總結出可以重復利用的經驗知識。
該模塊會進行如下反思:
為什么這條方程效果更好 / 更壞 / 無法執行?
從這次方程的生成中,可以總結出什么經驗或教訓?
總結出的知識以 idea 的形式存入 idea 庫(Idea Library),供后續輪次調用,提升生成策略的有效性。
模塊 c:方程生成 + 數值擬合
DrSR 的 “主控型 LLM” 負責綜合問題描述、數據分析結論和 idea 庫的經驗,生成方程 skeleton。隨后調用 BFGS 等優化器進行系數擬合,并評估方程的整體誤差。表達式被送回評估路徑,進入下一輪經驗提煉與數據再分析循環。
這個模塊是整個 DrSR 的 “前臺”,而 a 與 b 是強大的 “后端支持”。
總結來說,DrSR 的運行流程是一種閉環:
數據分析 → 提示引導 → 方程生成 → 評估打分 → 經驗總結,如此循環。每一次生成,模型都在積累知識、修正路徑,從 “盲目試探” 走向 “有的放矢”。
實驗結果:DrSR 不僅 “更準”,
還 “更快、更穩、更聰明”
研究團隊在六大符號回歸基準任務上系統評估了 DrSR 的性能,涵蓋物理、生物、化學、材料等多個科學領域,結果顯示 DrSR 全面超越現有主流方法,不僅準確率更高,而且在推理效率和泛化能力上也顯著領先。
全面領先的擬合精度與準確率
表 1. DrSR 和基線方法在六個符號回歸基準上的總體性能
如表 1 所示,平均來看,DrSR 在 6 個任務中有 5 個取得了最高準確率(Acc)和最低歸一化均方誤差(NMSE)。特別地,DrSR 在非線性阻尼振蕩系統建模任務(Oscillation 2)上達成了近乎完美的 99.94% 準確率,誤差低至 1.8e-12,顯著優于所有基線方法。
快速收斂:從一開始就更聰明
圖 2. 訓練收斂性比較
從圖 2 可以看到,DrSR 在幾乎所有數據集上都以更快速度達到更低的誤差。在初期迭代階段,其誤差下降趨勢也更穩定,不容易陷入振蕩或卡頓,這說明 DrSR 的雙推理策略能更有效引導方程生成方向,從而減少無效嘗試次數。
? 有效率更高:生成的方程更 “靠譜”
圖 3. 有效解比例對比
如圖 3 所示,DrSR 生成的方程在語法、編譯、可求值等方面的有效比例普遍高于 LLM-SR 約 10%-20%,這背后正是 “經驗學習” 機制的作用 —— 模型逐步避開常見失敗結構。
泛化更強,且對噪聲和 OOD 更魯棒
圖 4. 在 ID 和 OOD 數據下跨科學領域的泛化對比
圖 4 展示了 DrSR 在 ID(域內)與 OOD(域外)數據下的性能對比。可以看到:在所有任務、所有設置下,DrSR 的歸一化均方誤差(NMSE)始終是最低的,展現出極強的模型穩定性。其他方法(如 PySR 或 uDSR)雖然在部分任務中 ID 表現尚可,但面對 OOD 分布時誤差陡升、性能驟降,而 DrSR 則表現出了 “跨場景保持魯棒” 的能力。
表 2. 不同高斯噪聲水平下的性能比較
如表 2 所示,在不同高斯噪聲水平下,DrSR 均顯著優于 LLM-SR,展現出抗噪、抗漂移的泛化優勢。
消融實驗:兩個核心機制 “缺一不可”
圖 5. 消融實驗
圖 5 的消融實驗也驗證了兩個核心機制的重要性:沒有結構引導,模型不知從何生成;沒有經驗總結,模型容易反復試錯。DrSR 的成功,正是這兩者閉環協同的結果。
案例展示:DrSR 如何一步步逼近 “真實方程”
為了更直觀地展示 DrSR 的 “類科學家” 建模過程,研究團隊以非線性阻尼振蕩系統建模任務為例,繪制了其在 1000 次迭代過程中的方程演化軌跡,如圖 6 所示。
圖 6. DrSR 的性能軌跡與代表性表達式演化,每一個臺階,都是模型一次深刻的 “認知飛躍”
該任務的真實方程為:
DrSR 在僅 1000 輪迭代后生成的最優方程為:
基線 LLM-SR 在 2000 輪迭代后生成的最優方程為:
可以看到:DrSR 用一半的迭代次數,就生成了更接近真實結構的表達式,充分體現其 “有方向感” 的探索能力。
這一案例也展現出 DrSR 獨特的三大智能行為:
初期:大膽探索,快速淘汰
在前幾十輪中,DrSR 嘗試了一系列初步構造的方程,例如僅包含多項式組合的表達式(如 -0.5xv - 0.04x2 - 0.24v2 等),盡管形式接近,但精度仍遠未達到理想值。此階段模型更像一個 “實驗科學家”,快速試錯、積累經驗。
中期:融合非線性成分,跨越式發展
隨著經驗的積累與數據結構的洞察引入,DrSR 開始生成帶有 sin (x)、x2v 等非線性物理元素的表達式,方程擬合誤差明顯下降近兩個數量級,說明模型已開始理解系統的振蕩性本質。此時,它如同一個 “理論科學家”,開始用正確的符號結構組織規律。
后期:精煉組合,逼近真實動力學
最終,DrSR 提出了形如 0.8sin (x) - 0.5xv - 0.5v3 - 0.2x3 的復雜但精確表達式,誤差降至 10^-5 級別,接近人類解析解。這一過程高度模擬了科學發現中的 “假設 - 驗證 - 歸納” 的迭代式建模模式。
這個案例生動說明了 DrSR 如何結合 “結構洞察 + 經驗引導” 兩種智慧,逐步收斂到準確又可解釋的科學方程。
總結:讓大模型更像科學家,科學智能邁出關鍵一步
DrSR 提出了一種融合數據感知與經驗反思的符號回歸新范式,它通過結構洞察指導生成方向,通過經驗總結提升推理質量,讓大模型在科學建模中逐步具備 “看數據、記教訓、會修正” 的能力。
在多個跨學科的符號回歸任務中,DrSR 實現了對傳統方法與現有 LLM 基線的全方位超越,在準確率、收斂速度、方程有效性和泛化能力等維度表現突出。作為一套通用性強、可解釋性好、建模效率高的新架構,DrSR 為人工智能深度參與科學發現提供了堅實技術支撐。
DrSR 已集成至一站式智能科研平臺 ScienceOne,為科研工作者提供高效、可解釋的科學建模服務。值得強調的是,DrSR 并不依賴特定的大模型,具備良好的模型兼容性和可擴展性。未來,研究團隊將基于平臺自研的科學基礎大模型 S1-Base,進一步增強 DrSR 在科學建模中的推理能力與跨任務泛化能力。
局限與展望
盡管 DrSR 展現出優異的建模性能與類科學家的推理能力,但仍存在若干值得改進的方面:
輸出波動:由于大模型生成本身具有隨機性,部分方程可能存在結構冗余、表達復雜等問題,仍需人工后處理或規則約束。
模態輸入有限:DrSR 目前主要面向結構化數值數據,尚未支持圖像、圖表等更豐富的科學輸入形式,制約了其多模態建模能力。
這些問題正是未來演進的關鍵方向。研究團隊計劃繼續擴展 DrSR 至多模態科學建模場景,引入持續學習機制,提升策略泛化能力,逐步構建一個具備長期認知積累、適應科學復雜性的智能建模引擎。
讓人工智能不僅能 “擬合數據”,更能 “發掘自然規律”,這正是 AI4Science 走向深層科學智能的必由之路。
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.