引言
藥物的吸收、分布、代謝、排泄以及毒性(ADMET)性質預測對于藥物有效性和安全性至關重要,藥物發現早期進行ADMET性質預測,能大大降低藥物研發失敗的概率。傳統ADMET性質預測是基于分子指紋進行矢量化,近年來圖卷積方法在處理分子圖方面顯示巨大優勢。來自斯坦福大學和默克公司的團隊針對31個ADMET數據集系統比較了基于圖卷積的多任務深度學習方法與傳統基于分子指紋的隨機森林方法。

圖1. 預測ADMET的機器學習方法
圖片來源JMC
31個ADMET數據集測試結果
作者將當前的最新算法(GCNN-單任務和多任務PotentialNet)與許多大型制藥公司所使用的算法(基于atom pair描述符的隨機森林)進行了直接比較。在31種ADMET數據集上進行訓練,并比較了隨機森林和GCNN的結果在兩種不同的交叉驗證策略的測試集上的結果。結果顯示,多任務深度學習方法預測準確性都有明顯提升。

圖2. Temporal分割方法結果
圖片來源JMC
?

圖3. Temporal結合分子量分割方法結果
圖片來源JMC
?

圖4. Prospective分割方法結果
圖片來源JMC
模型泛化能力驗證
為了進一步確定模型的泛化能力,作者從學術文獻中獲得了外部測試集數據,包括大環化合物的膜滲透性和log D的數據,選擇該數據集是因為作者對高分子量的化合物進行了大量的一致性測量。?

圖5. 外部測試集泛化能力比較
圖片來源JMC
默克公司內部數據預測實戰
作者將2018年8月的模型用于預測默克公司兩個先導化合物優化項目中,結果展示出了較好的擬合效果。

圖6. 使用隨機森林模型和PotentialNet模型對默克公司內部數據進行的前瞻性預測
圖片來源JMC
總結
臨床前的藥物研究是藥物開發過程的關鍵階段,并且也是一個限速階段。藥物療效和ADMET屬性之間的多目標優化可能需要進行一些取舍和折中。準確地預測ADMET屬性既可以避免進入不良的藥物空間,也有利于更加快捷地獲得化合物。本文結果表明,利用圖卷積進行深度學習的預測模型大大優于基于分子指紋的RF預測模型。
參考文獻
Evan Feinberg, Elizabeth M Joshi, Vijay S. Pande, and Alan Cheng. Improvement in ADMET Prediction with Multitask Deep Featurization. J Med Chem, 2020. DOI: 10.1021/acs.jmedchem.9b02187