先睹為快
靶點
病原菌,超級細菌
模型訓練庫
FDA數據庫(1760個分子)
天然產物(800個分子)
篩選庫??
藥物庫:Drug Repurposing Hub(6111)
實體庫:ZINC15(~1億類抗生素分子)
計算方法??
有向消息傳遞的深度神經網絡(Directed message passing neural network)
計算軟件
RDKit, Chemprop
計算流程
作者首先利用藥物庫和天然產物構建了一個訓練集(2335個分子),并根據對大腸桿菌的抑制活性將化合物分為兩類:hits或者non-hits。隨后使用有向消息傳遞的深度神經網絡訓練模型,模型AUC值達到0.896。利用這個模型對藥物庫(Drug Repurposing Hub,6111)篩選發現具有廣譜抗菌效應的新型抗生素halicin(糖尿病藥物)。隨后對ZINC15中約1億類抗生素分子進行篩選,選擇預測打分>0.8并且與已知抗生素相似度<0.4的23個化合物,測試發現8個至少對一種細菌有效,其中2個具有廣譜抗菌效果。

有向消息傳遞深度神經網絡
作者使用有向消息傳遞深度神經網絡(directed-message passing neural network),直接從分子的圖結構中預測分子特性,其中原子表示為節點,鍵表示為邊界。作者重建了與每個化合物的SMILES字符串相對應的分子圖。接下來,作者初始化了一個特征向量,基于單個原子和鍵的可計算特征:原子特征:原子序數,每個原子的鍵數,電荷,手性,氫鍵數,雜化,芳香性,原子量。鍵特征:鍵類型(單/雙/三/芳香),共軛,環成員,立體化學。該模型應用了一系列消息傳遞步驟,在該步驟中,它將來自相鄰原子的信息匯總并結合,以建立對局部化學的理解。經過固定數量的消息傳遞步驟后,對分子中學習到的單個特征進行求和,以生成整個分子的單個特征。這種特征化通過前饋神經網絡進行饋送,輸出預測值。作者使用分子是否抑制大腸桿菌生長作為分類標準,因此訓練該模型輸出0或者1來表示它對于輸入分子的預測。
總結
作者使用深度學習構建了一個預測抗生素的篩選模型,特征向量使用有向消息傳遞深度神經網絡構建,而后使用前饋神經網絡進行訓練,鑒別出Halicin具有潛在的抗菌活性,且與已知的抗生素結構差距較大,后期又進行了生物活性測試,在動物模型上,halicin療效顯著。后期又對ZINC數據庫進行了預測,發現了8種與已知抗生素結構差別較大的分子。其中2中具有廣譜抗菌效果。

圖片來源:Cell

圖片來源:Cell
?

圖片來源:Cell

圖片來源:Cell
參考文獻
Stokes, J.M., et al., A Deep Learning Approach to Antibiotic Discovery. Cell, 2020. 180(4): p. 688-702 e13. DOI:?10.1016/j.cell.2020.01.021
?