總機:025-58361106-801
傳真:025-58361107-806
Email:info@njpeptide.com
地址:南京市化學(xué)工業(yè)園區(qū)方水路158號三樓
Nature Communications volume 15, Article number: 1611 (2024)

隨著生物技術(shù)的迅猛發(fā)展,針對特定蛋白質(zhì)靶點設(shè)計高親和力的肽類抑制劑成為了藥物研發(fā)領(lǐng)域的一項重要任務(wù)。本文介紹了一種結(jié)合了基于門控循環(huán)單元(Gated Recurrent Unit, GRU)的變分自編碼器(Variational Autoencoder, VAE)和Rosetta FlexPepDock的計算方法,用于生成肽序列并評估其與目標(biāo)蛋白的結(jié)合親和力。此外,通過分子動力學(xué)(Molecular Dynamics, MD)模擬進一步篩選肽類候選物,以進行實驗驗證。本研究成功應(yīng)用于設(shè)計特異性靶向β-連環(huán)蛋白和NF-κB基本調(diào)節(jié)子的肽抑制劑,其中部分設(shè)計的抑制劑展現(xiàn)出比母體肽更高的結(jié)合親和力。本導(dǎo)讀將全面深入地反映出該研究的核心內(nèi)容,并提供圖表資料以加深理解。
肽類抑制劑在藥物研發(fā)中扮演著重要角色,尤其是在抗生素發(fā)現(xiàn)和生物材料設(shè)計等領(lǐng)域。然而,設(shè)計特定蛋白-蛋白相互作用(Protein-Protein Interactions, PPIs)的肽抑制劑仍然是一個巨大的挑戰(zhàn)。傳統(tǒng)的基于結(jié)構(gòu)的方法和基于序列的方法都存在局限性,如引入偏差、搜索空間巨大、計算成本高等問題。
盡管AlphaFold等模型在識別高親和力肽結(jié)合體方面取得了成功,但其計算需求大且限于自然氨基酸,這對序列搜索和與流行的肽親和力成熟策略的兼容性構(gòu)成了挑戰(zhàn)。此外,現(xiàn)有的肽設(shè)計方法通常依賴于突變來優(yōu)化序列和結(jié)構(gòu),限制了全局能量最小化的搜索。
本研究的目標(biāo)是設(shè)計N端和C端擴展的肽類抑制劑,以提高其對β-連環(huán)蛋白的結(jié)合親和力。通過結(jié)合深度學(xué)習(xí)和基于結(jié)構(gòu)的建模與模擬,本研究旨在高效生成針對特定蛋白表面的高親和力肽結(jié)合體。
本研究采用了一種多步驟序列生成算法,該算法結(jié)合了基于深度學(xué)習(xí)的生成模型與基于結(jié)構(gòu)的建模和模擬。首先,使用GRU基VAE和Metropolis Hasting (MH)采樣算法生成潛在的肽序列。然后,通過Rosetta FlexPepDock快速評估VAE-MH生成的肽的結(jié)合親和力,并使用MD模擬對高排名的肽進行重新評估。

圖 2 | VAE-MH序列編碼和解碼過程示意圖。
研究方法包括以下幾個步驟:

圖 3 | Rosetta Design生成的N端或C端擴展的肽與VAE-MH模型生成的肽的結(jié)合能量評分比較。
本文首先介紹了β-連環(huán)蛋白的背景和其在細胞增殖中的作用,然后詳細描述了設(shè)計肽抑制劑的計算方法,包括VAE-MH模型的建立和優(yōu)化。接著,文章展示了通過Rosetta FlexPepDock和MM/GBSA方法篩選N端擴展肽的過程,并通過實驗驗證了所設(shè)計肽的有效性。最后,文章討論了所提出方法的優(yōu)勢和潛在的改進空間。
全文解讀:
本文介紹了一種計算方法,用于設(shè)計針對特定蛋白靶點的多肽抑制劑。這種方法結(jié)合了基于門控循環(huán)單元(GRU)的變分自動編碼器(VAE)與Rosetta FlexPepDock進行多肽序列生成和親和力評估,然后通過分子動力學(xué)模擬來縮小待實驗檢驗多肽的選擇范圍。研究聚焦于專門針對β-catenin和NF-κB基本調(diào)節(jié)器(NEMO)的多肽抑制劑的設(shè)計。試驗結(jié)果顯示,對β-catenin的十二個抑制劑中有六個展現(xiàn)出比父代多肽更好的結(jié)合親和力,最佳C端多肽的IC50值為0.010 ± 0.06 μM,比父代多肽改善了15倍。對于NEMO,四個測試的多肽中有兩個展示了明顯更優(yōu)的結(jié)合能力。
接下來通過對β-catenin的N端擴展,利用Rosetta Design和Rosetta FlexPepDock評估擴展多肽的結(jié)合能量,所得結(jié)果支持了通過N端或C端擴展來提高多肽9對β-catenin的親和力的可能性。通過VAE-MH過程引入的多肽擴展,經(jīng)Rosetta FlexPepDock和MM/GBSA計算后,部分多肽展現(xiàn)出比父代多肽更優(yōu)的結(jié)合特性。然而,這種改進程度適中,例如最優(yōu)N端擴展NAL-9的IC50值為0.084μM,大約是父代多肽的兩倍改善。
隨后通過化學(xué)合成和篩選組合多肽庫對β-catenin進行測試,旨在發(fā)現(xiàn)更強的多肽抑制劑。所選的幾種多肽基于在OBOC(一珠一化合物)多肽庫篩選后的序列進行合成和IC50測定。從這一策略中發(fā)現(xiàn),盡管VAE-MH導(dǎo)出的多肽展現(xiàn)出適度的親和力提高,但遺憾的是,N-端擴展策略未能顯著增強多肽的功效。
最后,文中討論了深度生成模型在設(shè)計高親和力特異性多肽抑制劑中的成功。
這包括兩個計算流水線的介紹:第一個流水線通過VAE-MH生成多肽擴展并通過Rosetta FlexPepDock和MM/GBSA進行排序和篩選;第二個流水線采用迭代細化的VAE-MH模型生成針對特定蛋白表面的C端或N端擴展。這些方法在設(shè)計具有高親和力的多肽方面展示了顯著的潛力,特別突出了結(jié)合了深度學(xué)習(xí)、生物物理學(xué)基于模擬的Rosetta Docking和分子動力學(xué)模擬的計算流程。
論文提出了一種針對特定靶點的肽類抑制劑的計算方法。該方法結(jié)合了基于門控循環(huán)單元的變分自編碼器和Rosetta FlexPepDock用于肽序列生成及結(jié)合親和力評估,隨后通過分子動力學(xué)模擬來縮小實驗檢測肽類的選擇范圍。研究旨在設(shè)計特定針對β-catenin和NF-κB基本調(diào)節(jié)子的肽類抑制劑。
此論文采用的研究方法可以歸類為“實驗研究”,綜合運用了深度學(xué)習(xí)和結(jié)構(gòu)基礎(chǔ)的建模模擬技術(shù),具體如下:
設(shè)計研究目標(biāo):通過增加肽的氨基酸鏈長度,來改善其與β-catenin的結(jié)合能力,并通過Rosetta FlexPepDock評估改造后的肽與β-catenin的結(jié)合能量。
使用計算工具:首先使用變分自編碼器(VAE)配合門控循環(huán)單元(GRU)模型生成N端或C端擴展的肽鏈,然后利用Rosetta FlexPepDock對不同長度擴展的肽進行結(jié)合能量分析,以評估其結(jié)合效率。
細節(jié)分析與優(yōu)選:深入分析擴展肽鏈的長度對其結(jié)合性能的影響,并將肽序列根據(jù)Rosetta FlexPepDock的評分從高到低排名選擇前十種進行分子力學(xué)(MM/GBSA)自由能計算,挑選出結(jié)合能量最佳的肽。
實驗驗證:最終挑選的幾種肽經(jīng)過實驗測試來驗證其抑制β-catenin的能力,并通過實驗數(shù)據(jù)進一步評估計算模型的準確性和有效性。
上述研究涵蓋了從計算模擬到實驗驗證的全流程,展現(xiàn)了結(jié)合深度學(xué)習(xí)模型與生物物理實驗手段的現(xiàn)代生物信息學(xué)研究方法。通過這種方法,研究人員不但能夠高效地篩選出具有潛力的肽類抑制劑,還可以系統(tǒng)地了解和解析肽-蛋白相互作用的微觀機制,為藥物設(shè)計和蛋白質(zhì)工程提供了新的視角和工具。
論文總結(jié):
研究方法:提出了一種針對特定靶標(biāo)(β-catenin和NF-κB essential modulator)設(shè)計特異性肽的計算方法,該方法結(jié)合了基于Gated Recurrent Unit的變分自編碼器和Rosetta FlexPepDock用于肽序列生成和結(jié)合親和力評估,進而使用分子動力學(xué)模擬來篩選實驗測定的肽。
主要發(fā)現(xiàn):
結(jié)論:該研究成功結(jié)合了深度學(xué)習(xí)和基于結(jié)構(gòu)的建模與模擬,為特定靶標(biāo)肽設(shè)計提供了新的計算方法,同時也發(fā)現(xiàn)了針對β-catenin具有改善結(jié)合能力的肽。
Design of target specific peptide inhibitors using generative deep learning and molecular dynamics simulations