99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里云等開發「中心法則」生物大模型,參數1.8B,涵蓋16.9W物種

0
分享至



該圖片由 Midjourney 生成。

編輯 | 白菜葉

從 DNA 的發現到對各種生物進行基因測序,「DNA 到 RNA 再到蛋白質」的「中心法則」一直是生命科學的核心原則。這三種承載信息的生物聚合物承擔著細胞內的大部分工作,進而決定了各種生物體的結構、功能和調控。

今天的故事就從「中心法則」開始。還記得去年 6 月 ScienceAI 報道過的開源生物大模型「LucaOne」嗎?不記得也不要緊,現在帶大家復習一下。

LucaOne 是首個聯合 DNA、RNA、蛋白質的生物大模型,由中山大學施莽、阿里云李兆融領導的聯合研究團隊開發。該模型旨在綜合學習遺傳和蛋白質組語言,涵蓋 169,861 個物種的數據。

該模型不僅可以對核酸、蛋白質的內部特征進行挖掘,還可識別核酸與蛋白質之間的聯系,可以幫助研究人員探索更多生物系統的內在邏輯與規則。

時隔一年,這項研究以「Generalized biological foundation model with unified nucleic acid and protein language」為題,于 2025 年 6 月 18 日刊登在了《Nature Machine Intelligence》雜志。



LucaOne 的核心亮點在于其獨特的自監督加半監督學習架構,該架構基于生物語言的本質屬性設計,使得模型能夠在 10 億量級的序列與注釋信息上進行學習,參數規模約 1.8 B。

讓我們簡單看一下 LucaOne 是怎樣工作的。



圖示:LucaOne 的工作流程。(來源:論文)

宏觀層面

相比于其他面向單類型數據的生物大模型 [DNA(如 DNABert2、EVO)、RNA(如 UniRNA)、蛋白質(如 ESM2)],LucaOne 是第一個面向生物學「中心法則」的這三種類型數據的基礎大模型。從 DNA 轉錄成 RNA 再翻譯成蛋白質,這些數據本身具有內源性,所以放在一起建模是合理的。

現有模型的只對序列進行自監督建模(序列的 mask 任務或者下一個 token 預測),LucaOne 是第一個將生物領域內大量的基礎并通用的標簽信息加入預訓練階段,讓模型能夠學習到足夠多的信息,從而表征能力足夠強大且通用。

「這個模型目標是希望學習生物系統的底層編碼,目前這個版本以基因組、轉錄組、蛋白質組為核心。其中的核苷酸及氨基酸序列是生物系統里的兩種模態,放在一起統一學習能幫助模型更快學習到生物系統的編碼體系。」去年這個項目開源時,這項研究的負責人李兆融對媒體解釋道。



圖示:分子生物學中心法則任務的工作流程。(來源:論文)

微觀層面

LucaOne 使用的是 Transformer-Encoder 架構,在此基礎上進行了一些局部設計,包括:

a. 將 DNA,RNA 與 Protein 的 Token 統一起來;

b. 除了本身的序列自監督學習,增加了 8 個基礎性的半監督學習任務,避免只對序列學習的不足問題(區別于文本,人類認識通過注釋這些分子本身不存在的標簽信息來認識與理解這些自然界語言的);

c. 多個半監督學習任務如何融合以及半監督信息的假陰性如何容錯;

d. 增加分子類型編碼與改進位置編碼等。

「這里我們考慮的是生物序列的信息密度,雖然不能這樣武斷的說,但是大致上基因組的信息密度是低于文本信息的,并且可能分布不均。比如,生物序列里可能會存在一些無意義片段,且片段非常長;應對這類問題,我們需要一些取巧的方式。」李兆融曾經表示,「因此,在我們設置了 8 個有監督的任務,這使得模型更有效的進行學習。」

「模型的參數有 1.8 B,什么概念呢?我們希望模型既足夠「大」,能理解復雜生物系統,又不至于太大影響下游的使用效率。在整理高質量數據后,我們將模型參數設置在這個級別。」

性能



圖示:具有三種輸入類型的下游任務網絡和八個驗證任務的結果比較。(來源:論文)

在后續的驗證測試中,LucaOne 在中心法則學習任務上取得了顯著成效,預測準確率達到 0.85,遠優于其他計算方法。

當分析細分表現時發現,LucaOne 在處理具有特殊進化適應性的生物如海鞘(Ciona intestinalis)時,預測表現特別差。海鞘利用中心法則的具體規則-密碼子偏好性,與其他生物明顯不同。

研究人員表示,這種情況可以認為海鞘用的是一種中心法則語法「方言」。而這種「方言」在訓練數據集里僅有 100 條,因此模型沒有很好的學習到這種規則。這表明了生物世界的多樣性與復雜性,也為模型未來的數據擴充和優化指明方向。

在另外廣泛選取的 7 個任務里,LucaOne 則表現優異,尤其是在流感 H3N2 病毒的免疫逃逸風險預測任務中,LucaOne 結合簡單感知機模型實現了 100% 的準確率,可以為這一類公共衛生的重要問題提供了有力的支持。

結語

在這里,LucaOne 不僅是一種通用工具的嘗試,它在回答一個開放性的問題:什么是「生物系統」的語言?這種語言能否被建模?顯然,答案正逐漸傾向于肯定,這與「中心法則」息息相關。不過,這個問題目前來看是沒有止境的,生命的規律還有太多未知在等待我們去破譯。LucaOne 是一個好的開端。

相信,隨著更多數據、更豐富模態的加入,以及模型的持續升級,LucaOne 將更深入揭示生物系統的智能,推動 AI 在生物科學、疾病診斷、藥物開發等領域的廣泛應用。

開源地址:https://github.com/LucaOne

論文鏈接:https://www.nature.com/articles/s42256-025-01044-4

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
家長醒醒吧,河北高考600分數段淪落,上211成為歷史

家長醒醒吧,河北高考600分數段淪落,上211成為歷史

解說阿洎
2025-06-26 13:28:27
男子坐了25年牢,出獄后去派出所辦身份證,所長看到他名字竟哭了

男子坐了25年牢,出獄后去派出所辦身份證,所長看到他名字竟哭了

歷史八卦社
2025-06-03 23:05:49
國務院官宣兩個好消息:除閱兵外,四個月后,兩岸同慶一個大日子

國務院官宣兩個好消息:除閱兵外,四個月后,兩岸同慶一個大日子

阿纂看事
2025-06-26 15:50:33
我想回中國!女孩被騙到印度貧民窟,獲救前反悔,老公身份不簡單

我想回中國!女孩被騙到印度貧民窟,獲救前反悔,老公身份不簡單

楊哥歷史
2025-06-25 11:40:15
伊朗防長訪華釋放重磅信號:殲-10CE與052D大單即將敲定?

伊朗防長訪華釋放重磅信號:殲-10CE與052D大單即將敲定?

淡然小司
2025-06-26 07:26:13
為什么近期突然把“干部違規吃喝”查得這么嚴?

為什么近期突然把“干部違規吃喝”查得這么嚴?

帝都觀日記
2025-06-25 14:10:08
1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

歷史偉人錄
2025-06-25 14:08:42
你無意中看到了什么不該看的東西?網友:每一個都是炸裂的存在

你無意中看到了什么不該看的東西?網友:每一個都是炸裂的存在

美好客棧大掌柜
2024-11-03 05:55:57
浙江調整生育津貼發放方式,7月1日起施行!

浙江調整生育津貼發放方式,7月1日起施行!

浙江發布
2025-06-26 10:27:00
男子沉迷修仙,竟前往神農架尋遠古巨蟲煉丹,3個月后異象突生

男子沉迷修仙,竟前往神農架尋遠古巨蟲煉丹,3個月后異象突生

古怪奇談錄
2025-06-23 16:01:11
浙江00后帶飯上班,堅持3天就受不了,網友:沒有對比就沒有傷害

浙江00后帶飯上班,堅持3天就受不了,網友:沒有對比就沒有傷害

阿龍美食記
2025-06-25 22:46:14
以軍對德黑蘭軍事目標展開打擊

以軍對德黑蘭軍事目標展開打擊

新京報
2025-06-23 17:15:02
傾家蕩產也不能治愈?提醒:這五種病根本無法根治,別白花冤枉錢

傾家蕩產也不能治愈?提醒:這五種病根本無法根治,別白花冤枉錢

健康八條
2025-06-25 22:25:56
伊駐華使館稱:特朗普意識到自己是以色列的“玩物”,但為時已晚

伊駐華使館稱:特朗普意識到自己是以色列的“玩物”,但為時已晚

明月聊史
2025-06-26 16:06:44
伊朗外長親口承認:中國不賣一枚導彈,卻給我們最硬的底牌!

伊朗外長親口承認:中國不賣一枚導彈,卻給我們最硬的底牌!

Ck的蜜糖
2025-06-25 06:09:03
中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

跑者排球視角
2025-06-25 23:56:08
NASA衛星照片證明美軍空襲炸偏了?

NASA衛星照片證明美軍空襲炸偏了?

樞密院十號
2025-06-22 23:06:01
2025年工齡一旦超過40年,養老金“跳”一檔?每5年“跳”一次?

2025年工齡一旦超過40年,養老金“跳”一檔?每5年“跳”一次?

社保精算師
2025-06-26 13:13:12
特朗普先生可能來華參加中國抗戰勝利80周年大閱兵的三點理由!

特朗普先生可能來華參加中國抗戰勝利80周年大閱兵的三點理由!

爆笑大聰明阿衿
2025-06-26 15:47:40
30歲女子直言:我就喜歡和黑人在一起的感覺,國內男人根本不入眼

30歲女子直言:我就喜歡和黑人在一起的感覺,國內男人根本不入眼

易玄
2025-06-24 19:03:23
2025-06-26 17:03:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
983文章數 214關注度
往期回顧 全部

科技要聞

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

體育要聞

蓄謀已久的開拓者,就是最適合楊瀚森的球隊

娛樂要聞

倪妮,怎么突然下桌了?

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

奇瑞最大轎車 風云A9L把VIP待遇和續航焦慮一起解決

態度原創

健康
教育
數碼
家居
軍事航空

呼吸科專家破解呼吸道九大謠言!

教育要聞

文科沒用?回答一下關于選專業的幾個問題

數碼要聞

田亮空降TCL奧運中國行重慶站:體驗眾多黑科技

家居要聞

木質簡約 空間極致利用

軍事要聞

滿足特朗普要求 北約峰會通過5%軍費目標

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 兴隆县| 新平| 汝南县| 侯马市| 观塘区| 东光县| 扎鲁特旗| 钟山县| 兴文县| 玛纳斯县| 永宁县| 营口市| 叙永县| 木里| 土默特左旗| 临西县| 岱山县| 苍溪县| 称多县| 南通市| 娄底市| 电白县| 南川市| 勐海县| 宜川县| 新和县| 贵德县| 都兰县| 红安县| 公安县| 霍邱县| 霍山县| 连南| 兰州市| 贵定县| 江阴市| 渑池县| 东宁县| 香格里拉县| 会泽县| 无棣县|