網易首頁 > 網易號 > 正文申請入駐

成功率提高3倍，David Baker通過可設計性偏好優化蛋白質序列設計

2025-06-18 12:52:34　來源: ScienceAI

天津舉報

分享至

編輯 | 蘿卜皮

近幾年，大家肯定聽說過許多「AI 根據序列設計蛋白質結構和功能」的研究。那么「AI 根據所需功能反向設計蛋白質序列」會怎么樣呢？

關于這個問題，單單從字面上就感覺后者比前者要復雜很多，事實也是如此。

由于訓練目標是序列恢復生成，所以根據理論逆向推導出的蛋白質序列，很難保證能夠在「真實世界」中折疊成我們所期待的樣子。

為了解決這一問題，悉尼科技大學（University of Technology Sydney）、浙江大學楊易團隊、華盛頓大學（University of Washington） David Baker 團隊等重新定義了訓練目標，增強了序列生成的可設計性。

他們提出了 ResiDPO（Residue-level Designability Preference Optimization）算法，通過殘基級結構反饋（pLDDT）優化蛋白質，提高其可設計性，同時解決了蛋白質結構預測中目標錯位問題。

為此，團隊還構建了一個帶 pLDDT 標簽的大規模數據集。研究人員使用該數據集，結合 ResiDPO 對 LigandMPNN 進行微調，最終得到 EnhancedMPNN 模型，顯著提升了設計效率：酶和結合劑設計成功率分別提高 3 倍和 2 倍，同時降低計算成本，加速了功能性蛋白質的研發周期。

該研究以「Improving Protein Sequence Design through Designability Preference Optimization」為題，于 20256 年 5 月 30 日發布在arXiv預印平臺。

蛋白質序列設計仍存在挑戰性

計算設計具有特定功能的蛋白質，在解決醫學和生物技術領域的突出挑戰方面具有巨大潛力。

當前的計算蛋白質設計流程通常將問題分解為兩個階段——首先生成骨架結構，然后進行「逆折疊」，最終得到相關序列。

雖然基于深度學習的蛋白質序列設計 (PSD) 已取得眾多突破，超越了 Rosetta 等傳統的基于物理的方法，但仍存在挑戰。

現有方法主要優化序列恢復——即在給定骨架的情況下復制天然序列的能力。然而，對于蛋白質結構和功能設計的成功，最重要的是設計序列與設計目標結構的折疊緊密程度。

正如預期的那樣，無論是蛋白質結合劑設計還是酶設計，可設計性與實驗成功率之間都存在很強的相關性。

挑戰在于，針對序列恢復優化的 PSD 模型通常可設計性較差。使用 RFDiffusion 和 ProteinMPNN 等現有方法進行酶設計，可設計性成功率僅為 3%。

這在計算上非常低效，阻礙了快速迭代和實驗驗證。科學家迫切需要能夠直接優化可設計性的方法。

提出了 ResiDPO

為了應對這些挑戰，研究人員著手直接優化一個類似 ProteinMPNN 的模型。該模型的靈感來源于諸如基于人類反饋的強化學習 (RLHF) 等對齊技術的成功，這些技術用于彌補大型語言模型（LLM) 中的目標函數差距。

他們的目標是明確地對齊 PSD 模型，使其能夠生成具有高可設計性的序列。蛋白質在這方面比自然語言模型更具優勢。

首先，為了避免主觀的人類偏好，他們選擇了 AlphaFold2 預測的局部距離差異測試 (pLDDT) 分數，該分數與結構準確性高度相關（圖 6），并為可設計性提供了定量的、客觀的獎勵信號。

其次，針對特定主鏈設計的固定長度序列允許進行細粒度的殘基級獎勵分配，這與 LLM 通常使用的序列級獎勵不同。

然后，該團隊提出了 ResiDPO，這是直接偏好優化 (DPO) 框架的一種升級，專門用于蛋白質設計。

圖示：ResiDPO 通過實現殘基水平可設計性，實現精確的蛋白質序列優化。（來源：論文）

ResiDPO 優于標準 DPO

標準 DPO 雖然能夠有效地利用序列級偏好來對齊語言模型，但在單純應用于 PSD 時會面臨挑戰。它會優化一個單一的損失函數，平衡偏好學習與一個 KL 散度項，該項正則化為原始模型分布。這可能會產生梯度沖突，尤其是在試圖提高高可設計性序列的概率時。

ResiDPO 通過利用殘基級 pLDDT 得分作為獎勵來克服了這個問題。它解耦了 DPO 損失：對于預測可提高可設計性的殘基（例如，初始 pLDDT 較低），它優先最大化偏好獎勵信號；對于已經對結構做出正向貢獻的殘基（例如，基礎模型中 pLDDT 高且置信度高），它優先使用 KL 正則化來維持已學習到的結構特征。

這種解耦提供了更清晰、更穩定的優化目標，直接增強了可設計性，避免了災難性遺忘。

ResiDPO 的性能評估

酶設計

為了評估 ResiDPO 的性能，該團隊使用了 RFDiffusion2 的酶活性位點支架基準。該基準提供了來自五個 EC 類別的五種酶，并確定了催化位點。

對于每種酶，研究人員用 RFDiffusion2 基于催化口袋生成 1,000 個骨架，并在 0.1 的溫度下使用 LigandMPNN、DPO 微調的 LigandMPNN 和 ResiDPO 微調的 LigandMPNN（EnhancedMPNN）為每個骨架設計了 8 個序列。在骨架和序列生成過程中，催化殘基均固定（未設計）。他們根據 pLDDT > 80 和 Cα RMSD < 1.5 ? 的標準評估設計成功率。

圖示：LigandMPNN、DPO 微調 LigandMPNN 和 ResiDPO 微調 LigandMPNN（EnhancedMPNN）在酶設計上的設計成功率。（來源：論文）

如上圖所示，與 LigandMPNN 和 DPO 相比，ResiDPO 顯著提高了序列設計的成功率。EnhancedMPNN 的平均序列設計成功率達到 17.57%，比 ligandMPNN（6.56%）提高了近三倍。

此外，可設計性的提升也顯著提高了骨架成功率（即至少有一個成功序列的骨架比例），從 LigandMPNN 的 19.74% 提升至 EnhancedMPNN 的 40.34%。

這表明 ResiDPO 不僅改進了序列設計，還擴展了可設計的骨架集，潛在地召回了更多可設計的從頭蛋白質，并節省了大量的計算資源。

蛋白質結合劑設計

圖示：LigandMPNN、DPO 微調 LigandMPNN 和 ResiDPO 微調 LigandMPNN（EnhancedMPNN）在結合劑設計基準上的設計成功率。（來源：論文）

如上圖所示，在蛋白質結合劑設計中，基線 LigandMPNN 的序列設計成功率為 7.07%。使用標準 DPO 進行微調后，該成功率略微提升至 10.40%。EnhancedMPNN 利用 ResiDPO，實現了 16.07% 的序列設計成功率，比基線 LigandMPNN 的成功率提高了一倍以上（約 2.27 倍）。

這說明，雖然 ResiDPO 并未針對蛋白質復合物或相互作用數據進行過明確的訓練，但它在提高復雜多鏈系統的可設計性方面具有強大的泛化能力。

結語

總而言之，ResiDPO 通過殘基級優化顯著提升了蛋白質設計的成功率與效率。這一突破不僅降低了計算成本，加速了蛋白質工程周期，也為 AI 驅動的功能蛋白質設計提供了新范式。未來，研究人員還可以進一步優化算法，探索更復雜的生物應用場景。

論文鏈接：https://arxiv.org/abs/2506.00297v1

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.