
文章簡介
藥物發現中的虛擬高通量篩選(vHTS)是一種識別苗頭化合物的有效方法,它可以比實驗性高通量篩選方法更快,更便宜。但是,主流的vHTS工具一般都有較大的局限性,這主要源于基于配體的篩選方法依賴于現有化學物質的知識和經驗,而基于結構篩選的工具(例如分子對接)涉及很大的近似值,從而限制了它們的準確性。隨著計算方法的發展以及GPU的計算處理的顯著提速,采用更嚴格的方法來提高vHTS方法的預測能力的成為可能。在本文中,我們認為使用基于全原子分子動力學模擬的煉金術結合自由能計算方法已經發展到可以在虛擬篩選工作中應用的水平,其主要可以在最終打分階段優先選擇最佳分子進行實驗測試。具體來說,我們提出煉金術絕對結合自由能(ABFE)計算在嚴格的統計熱力學框架內為虛擬篩選所需的各種分子的結合能的計算提供了最直接、計算效率最高的方法。ABFE計算對于當前的藥物發現十分有用,尤其是現在大規?;蚪M學數據和化學生物學方法的融合揭示了許多有希望的但還沒有小分子藥物發現的疾病靶標,而這恰恰是包括基于配體的篩選方法以及傳統的對接方法目前所不能真正發揮作用的地方。
背景介紹
高通量篩選(HTS)是大型制藥公司用于尋找靶標潛在苗頭化合物的傳統方法,歷經數十年來,已經積累了數百萬種化合物。盡管如此,HTS仍然非常昂貴且耗時,并且對具有挑戰性的靶標(例如KRAS,MYC,STING,PPI等)的命中化合物也很少,這是因為現有的化合物庫更多的是圍繞相對傳統的靶標(例如激酶,蛋白酶和GPCR等)且可能不包含任何與感興趣的靶標結合的分子。
近年來,虛擬高通量篩選(vHTS)通過計算篩選分子庫來發現苗頭化合物,其命中率顯著高于隨機篩選。當配體和結構信息同時存在時,可以組合使用多種方法以產生更好的結果。目前已經提出了許多改進對接打分方法的方法,例如MM/GBSA,其中添加了對接方法中缺少的一些能量項(如使用隱式溶劑模型處理水或包括有限的蛋白質動力學),但其在對接后重新打分上的準確性尚無定論,在某些情況下可以改善結果,而在其他情況下則不會。
本文提出煉金術自由能方法是最嚴格的用于預測結合自由能的全原子方法,計算效率最高,因此十分適合用于虛擬篩選。嚴格的結合自由能方法說明了對結合的主要能量貢獻,包括水(顯式表示),蛋白質動力學和系統的熵,以及更常用的能量項如蛋白質-配體相互作用和配體張力。此外,由于模擬的無偏性和考慮到蛋白質的靈活性質以及避免了基于配體的方法所需的參考配體,基于物理的嚴格的自由能方法比其他方法具有更多的優勢。盡管在本文撰寫之時對數百萬個分子進行嚴格的煉金術模擬尚不切實際,但在數以千計的分子上進行模擬是可行的,這可以為最終購買的用于實驗測試的分子的挑選帶來十分有益的參考。即使在將數十億個類藥物分子的超大型化合物庫對接以采樣廣闊的化學空間的情況下,也可以通過結合自由能模擬計算來評估最高打分結果,并以更高的打分質量來提高傳統的虛擬篩選的工作效率。圖1中顯示了一個分層的虛擬篩選漏斗,其中引入了絕對結合自由能(ABFE)模擬作為最終計算階段,然后才人工選擇要購買的化合物并進行實驗測試。?

圖1 引入ABFE計算的虛擬篩選過程
圖片源自JCIM.
分子結合的熱力學過程
在討論虛擬篩選方法之前,我們先簡要介紹生物分子識別(例如蛋白質-配體結合)背后的熱力學,這對于理解各種vHTS方法的優劣勢至關重要。在圖2中,我們展示了蛋白質-配體結合的特定熱力學分解。初始狀態是一種蛋白質和配體在水溶液中分離的狀態,類似于未結合配體的實際情況。配體存在于一組構象中(每個構象自由能的玻爾茲曼加權),并且由于側鏈和其他熱力學可及的運動,蛋白質同樣表現出運動。該蛋白質首先采用適合于所討論的特定配體的誘導契合構象(A),而該配體仍在溶液中(B)采取生物活性構象。接下來,以與結合過程(C和D)一致的方式使蛋白質和配體脫溶劑。最后,去溶劑化配體的生物活性構象與去溶劑化蛋白質的誘導契合構象一起形成蛋白質-配體復合物(E)。在此過程中,我們可以確定結合自由能的重要組成部分,包括構型熵的變化,蛋白質和配體的高能張力,水從配體和蛋白質表面轉移到本體溶劑中相關的去溶劑化能,以及蛋白質和配體之間的非鍵(焓)相互作用。

圖2 蛋白質-配體結合過程的熱力學分解
圖片源自JCIM.
傳統虛擬篩選方法
傳統的虛擬篩選方法可大致分為“基于配體的”和“基于結構的”兩種。其中前者包括基于一種或多種已知結合分子通過化學指紋、形狀、形狀加靜電、藥效團特征或可以與機器學習算法一起使用的其他表示形式。后一種方法(基于結構)主要由對接方法決定,該方法首先要生成可能的配體構象,然后在與蛋白質結合時評估這些配體結合模式的對接得分(即“采樣和打分”)。即使對接算法可以提供足夠準確的結合模式來表明復合物的所有關鍵相互作用(氫鍵,鹽橋,疏水相互作用,誘導契合效應等),也仍然存在從靜態表示中估算配體-蛋白質復合物能量不夠準確的事實,并且不準確的程度將隨著蛋白質柔性的提高而增加。例如,對接方法通常忽略了圖2中的箭頭A和C,當靶標蛋白是剛性的并且具有被所有配體均等去溶劑化的掩埋結合位點時,這可以是一個合理的近似值。但是,此類情況只是例外,而不是常規。另一方面所有這些打分函數都在許多方面受到圖2所示項的不正確描述的困擾:1.去溶劑化(配體和蛋白質);2.熵罰(配體,蛋白質和水);3. 構象張力(配體和蛋白質)。最后,基于知識的打分函數通過使用機器學習直接從訓練數據中進行學習,從而避免了由力場和經驗打分函數的固定功能形式帶來的限制。因此,基于知識的打分函數可以隱式捕獲難以明確建模的分子間結合相互作用。此前已經報道了許多基于知識的打分函數的實現,包括ML方法,例如隨機森林(RF),支持向量機(SVM),深度神經網絡(DNN)和卷積神經網絡(CNN)。
嚴格的結合自由能方法
雖然使用嚴格的自由能方法尚無法篩選數百萬種化合物,但如今在已經有了虛擬篩選背景下這些方法可以作為很好的補充,并且隨著計算資源的不斷提高以及計算成本的不斷下降,可以使用嚴格的自由能方法處理的化合物的數量將繼續增長。下面,我們將討論相對結合自由能(RBFE)的計算方法,因為它是藥物發現應用中最常用的煉金術自由能方法,即使RBFE計算不完全適用于虛擬篩選,因為它取決于分子之間的共性。而在虛擬篩選庫中,通常不存在這種共性,因為篩選的分子是多樣的。因此,對于虛擬篩選,ABFE計算更直接適用,并且我們認為ABFE是vHTS速度和準確性方面的最佳方法。
RBFE計算。1980年代中期,如McCammon和Jorgensen的實驗室首次證明的那樣,分子動力學和蒙特卡洛方法以及計算機的發展使將Zwanzig方程應用到實際系統成為可能。Zwanzig方程可用于蛋白質-配體結合的封閉熱力學循環,如圖3所示。常用的RBFE計算方法如FEP和TI,并且目前已經取得了不錯的計算精度和速度,具體的方法原理和發展過程可以參見此前文章“自由能方法及應用(三)煉金術自由能計算方法在藥物發現中的歷史”。?

圖3 用于RBFE計算的封閉熱力學循環
圖片源自JCIM
絕對結合自由能計算。在圖4中,我們可以看到絕對結合親和力的計算是相對自由能計算的一種特殊情況,其中第二個配體其實并不存在。這些計算取決于自由能循環,類似于上面的圖3中所示,但是被突變的配體(L’)替換為“nothing”(配體不再與系統相互作用)。ABFE方法具有與RBFE方法截然不同的擾動,并具有其自身的難點和特殊考慮。例如,“端點災難”由于較大的擾動而特別明顯,并且可能涉及溶劑分子進入結合腔。與蛋白質側鏈重組相比,水擴散的過程可能較慢(納秒與數百皮秒),因此,ABFE通常需要比RBFE更長的模擬時間才能獲得良好的準確性。幸運的是,用于虛擬篩選的將結合分子與非結合分子區分開所需的準確性低于典型的hit-to-lead和先導化合物優化工作,在這種情況下,對分子進行小的化學修飾通常會導致能量變化小于1千卡/摩爾,這抵消了ABFE相對于RBFE的一些其他計算要求。從藥物設計的角度來看,RBFE和ABFE代表了兩個截然不同的適用范圍。當接近化學準確性(例如1 kcal/mol)對于做出正確的預測至關重要時(如分子A是否比分子B具有更好的結合親和力,其中B代表對A的微小修飾),RBFE更適合于hit-to-lead和先導化合物的優化工作,而對于虛擬篩選,ABFE準確性僅需要足以將結合分子與非結合分子分離即可。?

圖4 用于ABFE計算的封閉熱力學循環
圖片源自JCIM.
嚴格的結合自由能方法的局限性
嚴格的結合自由能方法最主要的誤差來源是低質量力場和采樣不足。系統的所有組件都需要高質量的力場參數,以確保獲得可靠和準確的結果,包括蛋白質,溶劑,配體分子和其他輔助因子。其他局限性還包括模擬的設置,例如,通常在自由能模擬期間不對系統拓撲進行采樣,因此在整個模擬過程中將持續存在不正確的狀態(例如互變異構體和質子化狀態)。最后,從vHTS的全面角度看,最重要的是,高質量自由能的計算取決于結合位點(以及任何金屬,輔因子和其他生物學相關分子)中受體和配體結合模式的合適起始模型。在虛擬篩選的情況下,結合的配體結構必須來自分子對接或相關方法,這些方法具有上述對接部分所述的所有限制。此外,在嚴格的自由能計算的背景下,蛋白質-配體復合物中相互作用的數量越多,計算結果的誤差也會線性增加。
總結
盡管有許多嚴格的結合自由能方法可以用于虛擬篩選,但我們建議,煉金術ABFE方法最適合vHTS,因為其包含了計算結合能的所有相關物理原理,同時避免了昂貴且具有挑戰性的計算結合/解結合路徑??梢钥隙ǖ氖?,在vHTS工作流程中應用ABFE涉及許多挑戰,主要包括正確準備體系,優化模擬方案,采用增強的采樣方法,自動生成高質量的配體力場參數以及自動化在許多配體上運行ABFE模擬的過程。但是,這些問題可以通過適當的努力和專業知識來解決。隨著計算資源的不斷增加和計算成本的下降,嚴格的自由能計算方法將對虛擬篩選更具吸引力,最終將成為該領域的首選方法。
參考文獻
Rigorous Free Energy Simulations in Virtual Screening.Zoe Cournia, Bryce K. Allen, Thijs Beuming, David A. Pearlman, Brian K. Radak, and Woody Sherman. J. Chem. Inf. Model. 2020, 60, 4153?4169. DOI: 10.1021/acs.jcim.0c00116