99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

成功率提高3倍,David Baker通過可設計性偏好優化蛋白質序列設計

0
分享至



編輯 | 蘿卜皮

近幾年,大家肯定聽說過許多「AI 根據序列設計蛋白質結構和功能」的研究。那么「AI 根據所需功能反向設計蛋白質序列」會怎么樣呢?

關于這個問題,單單從字面上就感覺后者比前者要復雜很多,事實也是如此。

由于訓練目標是序列恢復生成,所以根據理論逆向推導出的蛋白質序列,很難保證能夠在「真實世界」中折疊成我們所期待的樣子。

為了解決這一問題,悉尼科技大學(University of Technology Sydney)、浙江大學楊易團隊、華盛頓大學(University of Washington) David Baker 團隊等重新定義了訓練目標,增強了序列生成的可設計性。

他們提出了 ResiDPO(Residue-level Designability Preference Optimization)算法,通過殘基級結構反饋(pLDDT)優化蛋白質,提高其可設計性,同時解決了蛋白質結構預測中目標錯位問題。

為此,團隊還構建了一個帶 pLDDT 標簽的大規模數據集。研究人員使用該數據集,結合 ResiDPO 對 LigandMPNN 進行微調,最終得到 EnhancedMPNN 模型,顯著提升了設計效率:酶和結合劑設計成功率分別提高 3 倍和 2 倍,同時降低計算成本,加速了功能性蛋白質的研發周期。

該研究以「Improving Protein Sequence Design through Designability Preference Optimization」為題,于 20256 年 5 月 30 日發布在arXiv預印平臺。



蛋白質序列設計仍存在挑戰性

計算設計具有特定功能的蛋白質,在解決醫學和生物技術領域的突出挑戰方面具有巨大潛力。

當前的計算蛋白質設計流程通常將問題分解為兩個階段——首先生成骨架結構,然后進行「逆折疊」,最終得到相關序列。

雖然基于深度學習的蛋白質序列設計 (PSD) 已取得眾多突破,超越了 Rosetta 等傳統的基于物理的方法,但仍存在挑戰。

現有方法主要優化序列恢復——即在給定骨架的情況下復制天然序列的能力。然而,對于蛋白質結構和功能設計的成功,最重要的是設計序列與設計目標結構的折疊緊密程度。

正如預期的那樣,無論是蛋白質結合劑設計還是酶設計,可設計性與實驗成功率之間都存在很強的相關性。

挑戰在于,針對序列恢復優化的 PSD 模型通常可設計性較差。使用 RFDiffusion 和 ProteinMPNN 等現有方法進行酶設計,可設計性成功率僅為 3%。

這在計算上非常低效,阻礙了快速迭代和實驗驗證。科學家迫切需要能夠直接優化可設計性的方法。

提出了 ResiDPO

為了應對這些挑戰,研究人員著手直接優化一個類似 ProteinMPNN 的模型。該模型的靈感來源于諸如基于人類反饋的強化學習 (RLHF) 等對齊技術的成功,這些技術用于彌補大型語言模型(LLM) 中的目標函數差距。

他們的目標是明確地對齊 PSD 模型,使其能夠生成具有高可設計性的序列。蛋白質在這方面比自然語言模型更具優勢。

首先,為了避免主觀的人類偏好,他們選擇了 AlphaFold2 預測的局部距離差異測試 (pLDDT) 分數,該分數與結構準確性高度相關(圖 6),并為可設計性提供了定量的、客觀的獎勵信號。

其次,針對特定主鏈設計的固定長度序列允許進行細粒度的殘基級獎勵分配,這與 LLM 通常使用的序列級獎勵不同。

然后,該團隊提出了 ResiDPO,這是直接偏好優化 (DPO) 框架的一種升級,專門用于蛋白質設計。



圖示:ResiDPO 通過實現殘基水平可設計性,實現精確的蛋白質序列優化。(來源:論文)

ResiDPO 優于標準 DPO

標準 DPO 雖然能夠有效地利用序列級偏好來對齊語言模型,但在單純應用于 PSD 時會面臨挑戰。它會優化一個單一的損失函數,平衡偏好學習與一個 KL 散度項,該項正則化為原始模型分布。這可能會產生梯度沖突,尤其是在試圖提高高可設計性序列的概率時。

ResiDPO 通過利用殘基級 pLDDT 得分作為獎勵來克服了這個問題。它解耦了 DPO 損失:對于預測可提高可設計性的殘基(例如,初始 pLDDT 較低),它優先最大化偏好獎勵信號;對于已經對結構做出正向貢獻的殘基(例如,基礎模型中 pLDDT 高且置信度高),它優先使用 KL 正則化來維持已學習到的結構特征。

這種解耦提供了更清晰、更穩定的優化目標,直接增強了可設計性,避免了災難性遺忘。

ResiDPO 的性能評估

酶設計

為了評估 ResiDPO 的性能,該團隊使用了 RFDiffusion2 的酶活性位點支架基準。該基準提供了來自五個 EC 類別的五種酶,并確定了催化位點。

對于每種酶,研究人員用 RFDiffusion2 基于催化口袋生成 1,000 個骨架,并在 0.1 的溫度下使用 LigandMPNN、DPO 微調的 LigandMPNN 和 ResiDPO 微調的 LigandMPNN(EnhancedMPNN)為每個骨架設計了 8 個序列。在骨架和序列生成過程中,催化殘基均固定(未設計)。他們根據 pLDDT > 80 和 Cα RMSD < 1.5 ? 的標準評估設計成功率。



圖示:LigandMPNN、DPO 微調 LigandMPNN 和 ResiDPO 微調 LigandMPNN(EnhancedMPNN)在酶設計上的設計成功率。(來源:論文)

如上圖所示,與 LigandMPNN 和 DPO 相比,ResiDPO 顯著提高了序列設計的成功率。EnhancedMPNN 的平均序列設計成功率達到 17.57%,比 ligandMPNN(6.56%)提高了近三倍。

此外,可設計性的提升也顯著提高了骨架成功率(即至少有一個成功序列的骨架比例),從 LigandMPNN 的 19.74% 提升至 EnhancedMPNN 的 40.34%。

這表明 ResiDPO 不僅改進了序列設計,還擴展了可設計的骨架集,潛在地召回了更多可設計的從頭蛋白質,并節省了大量的計算資源。

蛋白質結合劑設計



圖示:LigandMPNN、DPO 微調 LigandMPNN 和 ResiDPO 微調 LigandMPNN(EnhancedMPNN)在結合劑設計基準上的設計成功率。(來源:論文)

如上圖所示,在蛋白質結合劑設計中,基線 LigandMPNN 的序列設計成功率為 7.07%。使用標準 DPO 進行微調后,該成功率略微提升至 10.40%。EnhancedMPNN 利用 ResiDPO,實現了 16.07% 的序列設計成功率,比基線 LigandMPNN 的成功率提高了一倍以上(約 2.27 倍)。

這說明,雖然 ResiDPO 并未針對蛋白質復合物或相互作用數據進行過明確的訓練,但它在提高復雜多鏈系統的可設計性方面具有強大的泛化能力。

結語

總而言之,ResiDPO 通過殘基級優化顯著提升了蛋白質設計的成功率與效率。這一突破不僅降低了計算成本,加速了蛋白質工程周期,也為 AI 驅動的功能蛋白質設計提供了新范式。未來,研究人員還可以進一步優化算法,探索更復雜的生物應用場景。

論文鏈接:https://arxiv.org/abs/2506.00297v1

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
家長醒醒吧,河北高考600分數段淪落,上211成為歷史

家長醒醒吧,河北高考600分數段淪落,上211成為歷史

解說阿洎
2025-06-26 13:28:27
男子坐了25年牢,出獄后去派出所辦身份證,所長看到他名字竟哭了

男子坐了25年牢,出獄后去派出所辦身份證,所長看到他名字竟哭了

歷史八卦社
2025-06-03 23:05:49
國務院官宣兩個好消息:除閱兵外,四個月后,兩岸同慶一個大日子

國務院官宣兩個好消息:除閱兵外,四個月后,兩岸同慶一個大日子

阿纂看事
2025-06-26 15:50:33
我想回中國!女孩被騙到印度貧民窟,獲救前反悔,老公身份不簡單

我想回中國!女孩被騙到印度貧民窟,獲救前反悔,老公身份不簡單

楊哥歷史
2025-06-25 11:40:15
伊朗防長訪華釋放重磅信號:殲-10CE與052D大單即將敲定?

伊朗防長訪華釋放重磅信號:殲-10CE與052D大單即將敲定?

淡然小司
2025-06-26 07:26:13
為什么近期突然把“干部違規吃喝”查得這么嚴?

為什么近期突然把“干部違規吃喝”查得這么嚴?

帝都觀日記
2025-06-25 14:10:08
1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

歷史偉人錄
2025-06-25 14:08:42
你無意中看到了什么不該看的東西?網友:每一個都是炸裂的存在

你無意中看到了什么不該看的東西?網友:每一個都是炸裂的存在

美好客棧大掌柜
2024-11-03 05:55:57
浙江調整生育津貼發放方式,7月1日起施行!

浙江調整生育津貼發放方式,7月1日起施行!

浙江發布
2025-06-26 10:27:00
男子沉迷修仙,竟前往神農架尋遠古巨蟲煉丹,3個月后異象突生

男子沉迷修仙,竟前往神農架尋遠古巨蟲煉丹,3個月后異象突生

古怪奇談錄
2025-06-23 16:01:11
浙江00后帶飯上班,堅持3天就受不了,網友:沒有對比就沒有傷害

浙江00后帶飯上班,堅持3天就受不了,網友:沒有對比就沒有傷害

阿龍美食記
2025-06-25 22:46:14
以軍對德黑蘭軍事目標展開打擊

以軍對德黑蘭軍事目標展開打擊

新京報
2025-06-23 17:15:02
傾家蕩產也不能治愈?提醒:這五種病根本無法根治,別白花冤枉錢

傾家蕩產也不能治愈?提醒:這五種病根本無法根治,別白花冤枉錢

健康八條
2025-06-25 22:25:56
伊駐華使館稱:特朗普意識到自己是以色列的“玩物”,但為時已晚

伊駐華使館稱:特朗普意識到自己是以色列的“玩物”,但為時已晚

明月聊史
2025-06-26 16:06:44
伊朗外長親口承認:中國不賣一枚導彈,卻給我們最硬的底牌!

伊朗外長親口承認:中國不賣一枚導彈,卻給我們最硬的底牌!

Ck的蜜糖
2025-06-25 06:09:03
中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

中國女排比賽推遲!原因讓人無奈,唯一女教練帶隊,訓練可以暫停

跑者排球視角
2025-06-25 23:56:08
NASA衛星照片證明美軍空襲炸偏了?

NASA衛星照片證明美軍空襲炸偏了?

樞密院十號
2025-06-22 23:06:01
2025年工齡一旦超過40年,養老金“跳”一檔?每5年“跳”一次?

2025年工齡一旦超過40年,養老金“跳”一檔?每5年“跳”一次?

社保精算師
2025-06-26 13:13:12
特朗普先生可能來華參加中國抗戰勝利80周年大閱兵的三點理由!

特朗普先生可能來華參加中國抗戰勝利80周年大閱兵的三點理由!

爆笑大聰明阿衿
2025-06-26 15:47:40
30歲女子直言:我就喜歡和黑人在一起的感覺,國內男人根本不入眼

30歲女子直言:我就喜歡和黑人在一起的感覺,國內男人根本不入眼

易玄
2025-06-24 19:03:23
2025-06-26 17:03:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
983文章數 214關注度
往期回顧 全部

科技要聞

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

頭條要聞

媒體:英國公布針對中國的審計報告 對華“既要又要”

體育要聞

蓄謀已久的開拓者,就是最適合楊瀚森的球隊

娛樂要聞

倪妮,怎么突然下桌了?

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

奇瑞最大轎車 風云A9L把VIP待遇和續航焦慮一起解決

態度原創

旅游
房產
教育
本地
手機

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

教育要聞

文科沒用?回答一下關于選專業的幾個問題

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

手機要聞

Nothing Phone (3) 手機跑分曝光:驍龍 8s Gen 4芯片、16GB 內存

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 松阳县| 锦州市| 田林县| 武胜县| 大兴区| 四会市| 淮南市| 定襄县| 内黄县| 来安县| 陵川县| 同德县| 墨脱县| 兴城市| 巴青县| 城口县| 汶上县| 宁夏| 绥中县| 临澧县| 涿鹿县| 连江县| 虞城县| 衡阳市| 嘉兴市| 辰溪县| 宁武县| 沾益县| 玛纳斯县| 土默特右旗| 尼玛县| 鲁山县| 连平县| 澎湖县| 阿拉善左旗| 富裕县| 鞍山市| 中牟县| 五指山市| 玉屏| 通榆县|