99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

準確率是DeepSeek-R1兩倍以上,開源240億參數科學推理模型

0
分享至



編輯丨coisini

當前,大模型研究的重點已逐步轉向提升模型的推理能力。推理模型在數學、編程等領域的基準測試中已屢創突破。

那么,在需要認知策略、邏輯推演的科學研究領域,推理模型潛力如何呢?

最近,由前谷歌 CEO 埃里克?施密特(Eric Schmidt)投資的初創公司 FutureHouse,發布并開源了一個 240 億參數的化學任務推理模型——ether0,證明了:無需額外領域預訓練,通過后訓練即可使推理模型具備化學領域能力,且相比領域專用模型所需數據量顯著減少。



論文鏈接:https://storage.googleapis.com/aviary-public/ether0_preprint.pdf

模型鏈接:https://huggingface.co/futurehouse/ether0

科學推理模型 ether0

科學研究常涉及認知策略,如將問題分解為子問題、應對失敗案例、從目標結果逆向推理等 —— 這些策略正是推理模型所展現的特性。然而,盡管科學與推理模型在概念上高度契合,目前科學推理模型的研究仍相對匱乏,主要局限于多項選擇題基準測試。

要知道,評估解決方案的質量通常較為容易,而生成解決方案卻很困難。例如,我們雖能精確測量特定分子的溶解度,但設計具有目標溶解度的分子卻極具挑戰性。

FutureHouse 致力于改變這種現狀。

研究團隊從學術論文中整理了化學實驗數據,追蹤了分子溶解度和氣味等特性,并將其轉化為可驗證的問題。

ether0 基于 Mistral-Small-24B 架構,通過強化學習進行訓練,使用了 640,730 個基于實驗數據的化學問題,涵蓋 18 類(375 項)任務 —— 從合成可行性、血腦屏障滲透性到人體受體活性乃至氣味分析。



為實現高效訓練,該研究采用了一系列改進方案,包括推理行為蒸餾、動態課程學習等。

下圖展示了訓練流程各階段對模型多任務性能的貢獻。盡管 SFT 后初始準確率普遍較低,但在特定任務強化學習階段,所有任務性能均取得顯著提升。蒸餾過程成功將專家模型的能力遷移至通用模型,全任務強化學習階段成功修復了性能衰退,最終模型表現達到或超越對應專家模型水平。



高性能、低成本

為了全面評估 ether0 的能力,研究團隊將其與通用大語言模型(如Claude、o1)和化學專用模型(ChemDFM、TxGemma)進行對比。ether0 在所有開放答案(OA)類別中準確率最高,在選擇題(MCQ)方面也具備競爭力。

如下圖所示,幾乎在所有任務上,ether0 都超越了 GPT-4.1 和 DeepSeek-R1 等前沿模型。對于某些任務,ether0 的準確率甚至達到競爭對手的兩倍以上。



更驚人的是成本優勢:要達到類似的反應預測準確率,訓練一個非推理型模型需要消耗 50 倍以上的數據。



如下圖所示,安全對齊流程使 ether0 拒絕 80% 的不安全提問,但未對評測任務能力產生實質影響。



由于 ether0 只能以分子式和化學反應的形式生成解決方案,因此很難在獨立基準測試中與其他模型及人類表現進行交叉驗證。不過,ether0 能對未經訓練的分子結構進行正確推理。



總的來說,ether0 能理解自然語言提問,用自然語言進行推理,最終輸出分子結構,尤其擅長類藥分子設計。雖然 ether0 仍是原型產品,但研究團隊已通過其獲得多項重要發現,為未來構建通用科學推理模型指明了方向。

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俗稱“水米子”,30年前江里很多,上岸就死,至今無法規模化養殖

俗稱“水米子”,30年前江里很多,上岸就死,至今無法規模化養殖

貍貓之一的動物圈
2025-06-25 09:59:53
劉畊宏做客鐘麗緹北京豪宅,趕飯點吃六個菜,家里有倆保姆照顧她

劉畊宏做客鐘麗緹北京豪宅,趕飯點吃六個菜,家里有倆保姆照顧她

清游說娛
2025-06-18 11:14:39
楊瀚森:很喜歡20歲的生日禮物,沒辜負19歲的自己,你好NBA!

楊瀚森:很喜歡20歲的生日禮物,沒辜負19歲的自己,你好NBA!

林小湜體育頻道
2025-06-26 12:45:55
就在門頭溝!北京唯一國家一級重點保護野生植物,從2株擴繁至近500株

就在門頭溝!北京唯一國家一級重點保護野生植物,從2株擴繁至近500株

西山大喇叭
2025-06-26 12:29:48
人過80歲,只剩歸途,聰明的老人,會提前準備好這5件事

人過80歲,只剩歸途,聰明的老人,會提前準備好這5件事

小鬼頭體育
2025-06-26 09:51:38
中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

跑者排球視角
2025-06-25 23:56:08
尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

星宇共鳴
2025-05-21 17:58:05
警方通告!常州又一家公司暴雷!

警方通告!常州又一家公司暴雷!

常州大喇叭
2025-06-25 15:24:07
“老泄殘精,人窮壽盡”,提醒:60歲以后,牢記三不要

“老泄殘精,人窮壽盡”,提醒:60歲以后,牢記三不要

有故事的人
2025-06-25 06:32:14
2025高考狀元大洗牌:河南與湖南的傳統強校均顆粒無收,太意外!

2025高考狀元大洗牌:河南與湖南的傳統強校均顆粒無收,太意外!

涵豆說娛
2025-06-26 10:40:15
獲D評分遭看衰,為何開拓者敢16順位跳選楊瀚森?5大理由給出答案

獲D評分遭看衰,為何開拓者敢16順位跳選楊瀚森?5大理由給出答案

鍋子籃球
2025-06-26 11:41:52
開拓者GM羅寧:我們關注楊瀚森很久了,16號簽再不選后面可就不保險了!

開拓者GM羅寧:我們關注楊瀚森很久了,16號簽再不選后面可就不保險了!

雷速體育
2025-06-26 15:12:11
曝王政源已開始退贓款,母親出面,請求簽和解協議,受害者曬轉賬

曝王政源已開始退贓款,母親出面,請求簽和解協議,受害者曬轉賬

大笑江湖史
2025-06-26 11:28:00
戰火未歇經濟先崩:以色列超10萬家公司已倒閉

戰火未歇經濟先崩:以色列超10萬家公司已倒閉

敏睿縱覽
2025-06-23 16:10:02
亞足聯處罰中國足協!

亞足聯處罰中國足協!

FM93浙江交通之聲
2025-06-25 20:35:59
小楊哥倒臺竟是國家出手,三只羊迎來離職風波!內部紛紛爆料

小楊哥倒臺竟是國家出手,三只羊迎來離職風波!內部紛紛爆料

觀察鑒娛
2025-06-24 10:38:30
國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

大白聊IT
2025-06-14 22:40:59
楊瀚森第16順位被選中!NBA高管:這是我見過的最瘋狂的選秀

楊瀚森第16順位被選中!NBA高管:這是我見過的最瘋狂的選秀

雷速體育
2025-06-26 10:25:29
東風15C鉆透90米花崗巖!華夏神矛專破地堡,美軍鉆地彈甘拜下風

東風15C鉆透90米花崗巖!華夏神矛專破地堡,美軍鉆地彈甘拜下風

科學知識點秀
2025-06-26 07:00:13
Skip:當初馬威在湖人體檢未通過,實屬湖人管理層臨時變卦

Skip:當初馬威在湖人體檢未通過,實屬湖人管理層臨時變卦

雷速體育
2025-06-26 16:28:13
2025-06-26 17:07:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
983文章數 214關注度
往期回顧 全部

科技要聞

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

體育要聞

蓄謀已久的開拓者,就是最適合楊瀚森的球隊

娛樂要聞

倪妮,怎么突然下桌了?

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

奇瑞最大轎車 風云A9L把VIP待遇和續航焦慮一起解決

態度原創

藝術
親子
本地
旅游
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

用兒歌教孩子說“不”,開展性教育有趣比說教更管用|新京報快評

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

滿足特朗普要求 北約峰會通過5%軍費目標

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 温泉县| 寿阳县| 平江县| 九江市| 芜湖县| 高密市| 商河县| 罗平县| 乌兰察布市| 安达市| 开封市| 应城市| 武清区| 弋阳县| 天柱县| 晴隆县| 阳东县| 东莞市| 龙海市| 基隆市| 朝阳区| 澜沧| 沙湾县| 谢通门县| 洱源县| 屯昌县| 贵阳市| 子洲县| 楚雄市| 墨脱县| 乡城县| 中江县| 连云港市| 河源市| 晋江市| 木里| 神农架林区| 广丰县| 滦南县| 宾川县| 北票市|