背景介紹
藥物發現是一項具有挑戰性的任務,需要對多個參數進行優化,以適應不同的藥物性質。對于靶向特定生物大分子的藥物,藥物與其靶點之間的充分結合親和力是藥物藥效發展的基礎。由于這一過程的復雜性,發展最先進的方法,包括實驗和計算方法,可以加快項目進展和發現高質量的化合物,是極其重要的,與此同時,藥物發現研究也在不斷地探索創新方法。
近年來,為了預測藥物發現項目中的結合親和力,人們已經開發了多種計算機模擬方法,預測的質量隨著時間的推移而不斷改善。這些方法通常依賴于基于規則的物理模型或基于數據的機器學習(ML)和人工智能(AI)模型。其中,自由能微擾法(FEP)是一種基于統計力學的嚴格的自由能預測模型,由于其準確可靠的性能,在預測候選化合物與其生物靶點之間的結合親和力方面,受到越來越多的關注。FEP的計算依賴于一系列定義明確的中間煉金術態的定義,在兩個不同的物理態之間進行插值,并通過耦合參數的作用,將初始(參考)態逐漸轉化為最終(目標)態。典型的兩個例子是:計算兩種不同配體之間的相對結合自由能(RBFE)或計算配體與其生物靶點的絕對結合自由能(ABFE)。然而,到目前為止,由于FEP熱力循環的終端態之間存在顯著的結構差異,導致精度問題的出現,因此ABFE的使用受到了更多限制。盡管如此,ABFE計算也取得了重大進展,并實現了相關應用。人們眾多的努力使得FEP在藥物發現研究中,得到了更廣泛的應用。然而,由于可擴展性、可負擔性、效率和適用場景的限制等問題,FEP在藥物發現項目中更廣泛和普遍的使用,仍然存在局限性。
主要內容
自由能微擾(FEP),已廣泛應用于藥物發現項目中,用于預測候選化合物與其生物靶點之間的結合親和力。然而,目前FEP應用程序存在眾多局限性,包括但不限于成本高、等待時間長、可伸縮性有限和應用場景的廣度等。為了克服這些問題,來自晶泰科技有限公司的Peiyu Zhang & Mingjun Yang等人,開發了一個可擴展的云計算平臺XFEP,可以使用優化的模擬協議進行相對和絕對自由能預測。XFEP以一種更高效、可擴展和經濟的方式實現了大規模FEP計算,例如,使用50-100 GPUs可以在1周內對5000種化合物進行評估,計算成本大約相當于合成一種新化合物的成本。相關的研究成果以題為“A Cloud Computing Platform for Scalable Relative and Absolute Binding Free Energy Predictions: New Opportunities and Challenges for Drug Discovery”發布在國際著名期刊Journal of Chemical information and Modeling上。
在XFEP中,RBFE和ABFE協議都得到了進一步優化,并輔以了系統特定的精細化力場(FFs)和增強采樣。XFEP平臺構成了一個集成工作流的主干,該工作流將FEP計算與AI模型和濕實驗室實驗耦合起來。該工作流程能夠使用人工智能高效地產生目標導向的設計想法,使用給定生物系統的驗證FEP協議對假設想法進行快速評估和優先排序,濕實驗室合成優先排序的分子,以及活性和其他藥物性能的體外和體內測試。XFEP平臺使FEP應用程序在藥物發現項目中的命中識別、先導物選擇和先導物優化場景中更具可擴展性、可負擔性和效率。
在本研究中,研究者通過RBFE和ABFE計算研究了XFEP平臺的性能,這些計算分別對應于藥物發現場景的命中識別、先導物選擇和優化、蛋白-蛋白相互作用中的蛋白突變效應、藥物選擇性和耐藥性。
XFEP云計算平臺的特性
可擴展性:FEP計算的本質,即許多λ窗口(11或22)短模擬(即1或2 ns)和許多不同的化合物,使它成為在云計算平臺上以完全可擴展的方式使用的理想工具。充分利用這種可擴展性,一個項目的FEP計算實例的典型數量可以從數十個或數百個擴展到數千個甚至更多,潛在地允許計算分子的數量增加兩倍。
高效性:氫傳質允許使用更大的時間步長,這可以加快模擬的兩倍。協定的λ方案可以將λ窗口總數從22個減少到11個,從而提高仿真速度。結果表明,FEP模擬的GPU成本可以降低8倍,同時以最小的統計不確定性增加產生類似的結果。
可負擔:通過這些努力來提高FEP計算的效率,可以根據取決于系統的大小、采用何種FEP協議(有效或完整)以及是否可以使用現場實例模式的節點進行計算,一個分子的FEP計算成本從不到1美元到10美元不等。在一個內部藥物發現項目中,使用50-100個GPU,在1周內完成了對5000個設計化合物的FEP評估,該評估針對一個擁有37000個原子的中型系統,使用高效協議,總成本約相當于合成一種新化合物(2500美元)。
圖表匯總

表1. 8種蛋白質靶標配體構建的模型化合物中FF和QM柔性扭轉能量分布比較
表格來源于JCIM
?

圖 1.?XFEP云計算平臺的圖形用戶界面
圖片來源于JCIM
?

圖2. FEP預測的RBFE ΔΔG值與所有8個生物靶標的實驗數據之間的相關性
圖片來源于JCIM
?

表2.?XFEP和FEP+的性能綜述(均方根誤差kcal/mol)
表格來源于JCIM
?

?圖3.?8種生物靶標的預測相對自由能變化進行比較
圖片來源于JCIM
?

圖4.?CDK2、Jnk1、p38和Tyk2化合物的ABFE預測值與實驗數據之間的相關性
圖片來源于JCIM
?

圖5.?所有BRD4化合物的ABFE預測值與實驗數據之間的相關性
圖片來源于JCIM
?

表3. 突變引起SGPB與OMTKY3之間結合自由能的變化(實驗和計算的ΔΔG數值比較,單位為kcal/mol)
表格來源于JCIM
?

表4. 單突變引起的阿西替尼與激酶Abl結合自由能的變化值(實驗和計算的ΔΔG數值比較,單位為kcal/mol)
表格來源于JCIM
?

表5. 化合物CEP-701對MAP4K蛋白家族的選擇性XFEP計算和實驗測定值(單位為kcal/mol)
表格來源于JCIM
?

圖6.?不同FFs下RBFE預測誤差(ΔΔGexp?– ΔΔGFEP)的概率密度分布
圖片來源于JCIM
圖7.?關于FEP預測的R2(左)和τ(右)實驗值范圍的變化(由高斯分布的標準差、σexp表示)和RMSE
圖片來源于JCIM
結論總結
本篇文章,研究者提出了一個可靠的計算機模擬平臺XFEP,可用于各種藥物發現場景中的RBFE和ABFE預測。憑借其集成的基于云的框架和隨時可用的協議,XFEP為藥物發現項目提供了大規模FEP計算的高效和可負擔的方式。這些進展,加上人工智能技術在目標導向分子生成和評估方面的應用,為FEP在藥物發現階段(靶點識別、靶點到先導物、先導物優化)的應用提供了更多的機會,不僅可用于開發R-基團替換和核心跳躍,還可以比較完全不相關的分子。從對給定生物目標具有驗證性能的FEP協議開始,使用50-100個GPU,可以在1周內完成5000種設計化合物的可擴展FEP評估,其成本大約相當于合成一個新化合物的成本。預計將來,可擴展的FEP應用,與AI建模緊密結合,將在藥物發現場景中得到更廣泛的應用,以加速從臨床前候選化合物提名階段的進展。
參考文獻
Zhixiong Lin, Junjie Zou, Shuai Liu, Chunwang Peng, Zhipeng Li, Xiao Wan, Dong Fang, Jian Yin, Gianpaolo Gobbo, Yongpan Chen, Jian Ma, Shuhao Wen, Peiyu Zhang, and Mingjun Yang, A Cloud Computing Platform for Scalable Relative and Absolute Binding Free Energy Predictions: New Opportunities and Challenges for Drug Discovery, Journal of Chemical Information and Modeling, 2021, 61, 6, 2720-2732. DOI: 10.1021/acs.jcim.0c01329.