99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

大模型聽懂育種語言,提出首個種子科學多任務評測基準SeedBench

0
分享至



編輯 | ScienceAI

種子,堪稱農業的「芯片」。當前我國種業與國際頂尖水平仍有差距,部分高端種源仍然依賴進口。種業創新,任重道遠——研發周期漫長、專業數據分散、多種學科復合、專業人才缺乏。

大語言模型(LLMs)的出現,似乎為育種科研帶來了新可能!大語言模型通過學習海量數據,可以打通學科壁壘,未來還能推動育種向數智化轉型,助力種業「彎道超車」。不過,大語言模型在育種領域的應用仍面臨專業數據稀缺和缺乏標準化評估體系等瓶頸,制約了大模型驅動的智能育種的發展。

為此,上海人工智能實驗室聯合崖州灣國家實驗室、上海創智學院推出首個專注于種子科學的多任務評測基準SeedBench,可全面評估大模型在育種科研中的效用。SeedBench涵蓋基因信息獲取與分析基因功能與調控機制分析品種選育與農藝特性優化三大育種階段,為人工智能賦能生物育種提供客觀能力參考。



論文標題:SeedBench: A Multi-task Benchmark for Evaluating Large Language Models in Seed Science

論文鏈接:https://arxiv.org/pdf/2505.13220

數據開源:https://github.com/open-sciencelab/SeedBench

研究背景

當前全球種業正經歷從「經驗育種」向「智能育種」的跨越式發展。

據聯合國糧農組織統計,近二十年全球作物增產超50%,技術進步是核心驅動力。同時,基因組測序技術飛速進步,單個作物性狀可能受數百個基因位點調控,傳統人工分析方法已難以應對,將數據驅動的人工智能算法融入育種成為必由之路。特別是大語言模型,能夠處理大量的遺傳、環境和農學數據,從而提高育種效率。

盡管大模型已在醫療、法律、金融等領域取得顯著成效,但在育種領域的應用仍面臨諸多挑戰:

?數據之困:育種相關數據(如基因功能、農藝性狀)在互聯網中的占比較低,限制模型訓練效果。部分田間記錄仍存在紙面,大量隱性經驗難以數字化傳承。

?評估之缺:對比醫療、法律、金融等領域已有成熟評測基準(如FinBench、LawBench),育種領域缺乏覆蓋全流程的評估基準,導致大語言模型優化缺乏方向。

?跨學科復雜性:育種涉及遺傳學、分子生物學、環境科學等多領域知識,大語言模型需理解基因-性狀間復雜關聯并生成田間適用的建議。

總之,智能育種這條路并不平坦。讓大模型能聽懂育種的語言,SeedBench,只是邁出的一小步。

構造方法



SeedBench研究團隊首先提取了308,727篇與育種相關的中英文文獻,統一轉換為Markdown格式。經過數據清洗得到一個包含1.1-billion-token的育種語料庫。

在此基礎上,育種專家從中精選出279個高質量文本塊,涵蓋基因信息獲取與分析、基因功能與調控機制分析、品種選育與農藝特性優化三大育種階段,并提供了包含單項選擇題、多項選擇題、填空題和生成題的示例問題交由LLM進行擴充和變化。驗證環節包括自動化審查與專家評審,剔除了低質量內容,并確保題目有價值且與育種高度相關。

最終,SeedBench提供了覆蓋多任務類型的2,264道高質量題目,實現對LLM在3個育種階段、10個育種能力的細粒度評估。

評測任務設計

SeedBench模擬育種專家工作流,覆蓋以下三個育種階段:





數據集題目展示

以下為SeedBench中的題目示例:

基因基本信息查詢



基因功能實驗觀察



品種選育過程查詢



評測結果與發現

通過對27個主流LLM(包括GPT-4、Gemini、Claude及開源模型)的測試,SeedBench揭示關鍵結論:

1.領域模型表現不佳:領域微調模型(如PLLaMa)表現不佳,得分低于通用模型,可能的原因是:微調后通用能力下降;針對過窄的任務微調、在過窄的數據上后訓練;使用了未經專家驗證的數據等等。

2.參數規模與性能:7B~14B參數模型在性能與計算成本間達到最佳平衡(如Qwen2.5-14B)。

3.推理模式失效:Reasoning模式(如Gemini-2.0-Flash,OpenAI o1-mini)反而降低育種任務中的答案精確性。



總結與展望

SeedBench作為首個針對種子科學的大語言模型評測基準,其專家級數據質量由育種專家設計并驗證,確保問題具有高度專業性和廣泛覆蓋度。SeedBench研究團隊通過與領域專家合作,模擬真實育種場景,并實施嚴格的兩階段驗證流程,確保評測的科學性與可靠性。

這一工作流不僅為種子科學提供了精準的評估工具,還為科學智能的基準設計提供了可借鑒的參考框架。SeedBench的推出對未來科研工作具有重要指導意義:它通過覆蓋基因信息分析、功能調控與品種優化三大育種階段,為大模型在農業中的優化提供了清晰方向,推動AI技術從通用領域向農業垂直場景的落地。

實際應用中,基于SeedBench評測的首個種業大模型「豐登」(SeedLLM)[1]已于近日開放申請使用(https://seedllm.org.cn/),助力生物育種效率提升。

未來,研究團隊計劃進一步拓展SeedBench對育種大模型的評估能力,持續優化數據的多樣性,融合多組學、表型圖片、傳感等更多數據模態,擴展更多作物,貼近真實育種環境,推動大模型在育種場景的實際應用。

聯系團隊

歡迎對「大模型+生物育種」感興趣的有志之士聯系豐登聯合研發團隊。除學術合作外,團隊常年開放研究員、工程師、博士后、聯培博士生、實習生等崗位。

聯系人:楊博士

郵箱:yangfan@yzwlab.cn

工作地點:三亞、北京、深圳、上海

參考文獻

[1]Yang, F., Kong, H., Ying, J., Chen, Z., Luo, T., Jiang, W., Yuan, Z., Wang, Z., Ma, Z., Wang, S., Ma, W., Wang, X., Li, X., Hu, Z., Ma,X., Liu, M., Wang, X., Chen, F. and Dong, N. (2025). SeedLLM· Rice: A large language model integrated with rice biological knowledge graph.Molecular Plant.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俗稱“水米子”,30年前江里很多,上岸就死,至今無法規模化養殖

俗稱“水米子”,30年前江里很多,上岸就死,至今無法規模化養殖

貍貓之一的動物圈
2025-06-25 09:59:53
劉畊宏做客鐘麗緹北京豪宅,趕飯點吃六個菜,家里有倆保姆照顧她

劉畊宏做客鐘麗緹北京豪宅,趕飯點吃六個菜,家里有倆保姆照顧她

清游說娛
2025-06-18 11:14:39
楊瀚森:很喜歡20歲的生日禮物,沒辜負19歲的自己,你好NBA!

楊瀚森:很喜歡20歲的生日禮物,沒辜負19歲的自己,你好NBA!

林小湜體育頻道
2025-06-26 12:45:55
就在門頭溝!北京唯一國家一級重點保護野生植物,從2株擴繁至近500株

就在門頭溝!北京唯一國家一級重點保護野生植物,從2株擴繁至近500株

西山大喇叭
2025-06-26 12:29:48
人過80歲,只剩歸途,聰明的老人,會提前準備好這5件事

人過80歲,只剩歸途,聰明的老人,會提前準備好這5件事

小鬼頭體育
2025-06-26 09:51:38
中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

跑者排球視角
2025-06-25 23:56:08
尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

尼日爾暫緩 4 億美元款項并調整中企人員,我方早有預案妥善應對

星宇共鳴
2025-05-21 17:58:05
警方通告!常州又一家公司暴雷!

警方通告!常州又一家公司暴雷!

常州大喇叭
2025-06-25 15:24:07
“老泄殘精,人窮壽盡”,提醒:60歲以后,牢記三不要

“老泄殘精,人窮壽盡”,提醒:60歲以后,牢記三不要

有故事的人
2025-06-25 06:32:14
2025高考狀元大洗牌:河南與湖南的傳統強校均顆粒無收,太意外!

2025高考狀元大洗牌:河南與湖南的傳統強校均顆粒無收,太意外!

涵豆說娛
2025-06-26 10:40:15
獲D評分遭看衰,為何開拓者敢16順位跳選楊瀚森?5大理由給出答案

獲D評分遭看衰,為何開拓者敢16順位跳選楊瀚森?5大理由給出答案

鍋子籃球
2025-06-26 11:41:52
開拓者GM羅寧:我們關注楊瀚森很久了,16號簽再不選后面可就不保險了!

開拓者GM羅寧:我們關注楊瀚森很久了,16號簽再不選后面可就不保險了!

雷速體育
2025-06-26 15:12:11
曝王政源已開始退贓款,母親出面,請求簽和解協議,受害者曬轉賬

曝王政源已開始退贓款,母親出面,請求簽和解協議,受害者曬轉賬

大笑江湖史
2025-06-26 11:28:00
戰火未歇經濟先崩:以色列超10萬家公司已倒閉

戰火未歇經濟先崩:以色列超10萬家公司已倒閉

敏睿縱覽
2025-06-23 16:10:02
亞足聯處罰中國足協!

亞足聯處罰中國足協!

FM93浙江交通之聲
2025-06-25 20:35:59
小楊哥倒臺竟是國家出手,三只羊迎來離職風波!內部紛紛爆料

小楊哥倒臺竟是國家出手,三只羊迎來離職風波!內部紛紛爆料

觀察鑒娛
2025-06-24 10:38:30
國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

大白聊IT
2025-06-14 22:40:59
楊瀚森第16順位被選中!NBA高管:這是我見過的最瘋狂的選秀

楊瀚森第16順位被選中!NBA高管:這是我見過的最瘋狂的選秀

雷速體育
2025-06-26 10:25:29
東風15C鉆透90米花崗巖!華夏神矛專破地堡,美軍鉆地彈甘拜下風

東風15C鉆透90米花崗巖!華夏神矛專破地堡,美軍鉆地彈甘拜下風

科學知識點秀
2025-06-26 07:00:13
Skip:當初馬威在湖人體檢未通過,實屬湖人管理層臨時變卦

Skip:當初馬威在湖人體檢未通過,實屬湖人管理層臨時變卦

雷速體育
2025-06-26 16:28:13
2025-06-26 17:07:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
983文章數 214關注度
往期回顧 全部

科技要聞

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

體育要聞

蓄謀已久的開拓者,就是最適合楊瀚森的球隊

娛樂要聞

倪妮,怎么突然下桌了?

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

奇瑞最大轎車 風云A9L把VIP待遇和續航焦慮一起解決

態度原創

數碼
時尚
房產
親子
游戲

數碼要聞

田亮空降TCL奧運中國行重慶站:體驗眾多黑科技

“淺口鞋”今年夏天爆火!這5雙怎么搭都好看

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

親子要聞

用兒歌教孩子說“不”,開展性教育有趣比說教更管用|新京報快評

CS2明星選手喜提保時捷911:車牌"幀數"很高很電競

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 鞍山市| 太仓市| 龙游县| 千阳县| 宁安市| 义马市| 体育| 双鸭山市| 广东省| 小金县| 合水县| 沈阳市| 休宁县| 莆田市| 马尔康县| 合作市| 遵义市| 谷城县| 聊城市| 嵊泗县| 阿瓦提县| 汝州市| 虹口区| 柳河县| 新巴尔虎右旗| 塔城市| 桂林市| 灵璧县| 广灵县| 三江| 谢通门县| 洞头县| 曲周县| 黄龙县| 枣阳市| 卓尼县| 德清县| 延寿县| 略阳县| 嫩江县| 玛纳斯县|