<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JCIM | AIScaffold: 基于深度學習的在線骨架衍生工具

    JCIM | AIScaffold: 基于深度學習的在線骨架衍生工具

    引言

    分子骨架在藥物化學領域使用十分廣泛,尤其是那些具有較好生物活性的骨架(在某些定義下的優勢骨架),常被用作先導化合物優化的起點。為了能夠更好地利用骨架里包含的信息進行藥物設計,研究人員開發了各種算法來識別、組織和可視化骨架。近年來,隨著深度學習在藥物設計領域的應用不斷增加,許多基于深度學習的算法也被開發用于分子生成。其中一些是從頭生成算法,而另一些則是基于分子骨架的方法(即骨架衍生)。

    目前已有許多基于骨架的生成算法來實現骨架衍生,但這些算法的共同缺點是難以直接被藥物化學家使用。部分算法僅提供了對模型架構的簡單描述,使得不具備深度學習知識的研究人員無法重現模型。一些程序開源了代碼,但是仍需要研究人員配置環境部署服務,這對于不熟悉服務器端操作系統(通常為Linux)的人來說仍很困難。由于這一缺點,這些方法的貢獻通常局限于學術界,而沒有被更廣泛地應用。目前還沒有有效且易用的在線工具來實現骨架衍生。

    近日,望石智慧公司和北京大學藥學院發表了AIScaffold,一個基于深度生成模型的骨架衍生在線工具。該工具基于他們先前提出的算法DeepScaffold,并添加了排序方法,可以快速進行大規模骨架衍生。通過GPU加速,該工具可以對用戶給出的起始骨架在幾分鐘內完成數十萬量級的衍生并推薦排名前500的分子,且支持定點衍生等特性。工具注冊后提供90天試用期,且提供離線部署解決方案,從而可以被學術界和工業界輕松使用,加速藥物設計進程。

    方法——分子生成

    生成模型基于用戶提供的分子和參考分子執行骨架衍生,該過程逐步進行,在每個步驟中,模型決定采取以下哪一個操作:(1)添加新原子;(2)連接兩個現有原子;(3)終止生成。生成模型的體系結構和訓練方法與DeepScaffold相同,生成過程中的唯一修改是添加了定點衍生。在藥物設計中,有一些子結構對于分子的生物活性至關重要。藥物化學家需要確保這些子結構在多元化后保持不變,即衍生僅發生在特定地點。定點衍生通過給policy matrix添加mask來實現,具體操作方法見3.2。

    方法——生成后篩選

    生成模型可以在幾分鐘內生成多達五十萬個分子,而藥物化學家通常只需要幾十個甚至十幾個分子作為藥物設計的起點。這就需要高質量的篩選算法來確定最有前景的分子。算法篩選過程分為兩個階段,每個階段均由多個模塊組成(圖1)。第一階段是粗篩層,目的是快速去除生物活性低、不穩定或難以合成的分子,從而減少分子整體數量。粗篩層由基于藥效團的分子相似性打分、基于經驗的集團篩選和合成可及性打分三個模塊組成。每個模塊均為高通量算法,可以使用單核CPU在幾分鐘內對多達五十萬個分子進行打分,并將其中有潛力的前十萬個呈遞到下一階段(精篩層)。第二階段是精篩層,該階段的目的是快速準確地挑選出具有更好生物活性的分子。在精篩層,模型從第一階段呈遞過來的十萬個分子挑選最有前景的五百個分子展示給用戶,該過程在幾分鐘內完成。精篩層由基于機器學習的活性預測模型、基于機器學習的ADMET、3D疊合模型和對接方法四個模塊組成。

    JCIM | AIScaffold: 基于深度學習的在線骨架衍生工具

    圖1. 生成后篩選流程。

    圖片來源:J. Chem. Inf. Model.

    ?

    網站服務器——模型工作流程

    模型對用戶的輸入執行大規模的骨架衍生,得到約五十萬個分子,之后進入篩選階段,在粗篩層之后保留前十萬個分子,而在精篩層之后呈遞最有前景的500個分子。整體工作流程如圖2所示。

    JCIM | AIScaffold: 基于深度學習的在線骨架衍生工具

    圖2. AIScaffold工作流程。

    圖片來源:J. Chem. Inf. Model.

    網站服務器——輸入

    輸入包括:(1)起始骨架;(2)參考分子;(3)定點衍生(可選)。起始骨架是骨架衍生的起點,輸入方式包括(1)輸入SMILES;(2)使用JSME分子編輯器繪制;(3)上傳結構圖片;(4)上傳后綴為”.sdf”、”.mol”或”.smi”的文件。輸入支持3D結構,并會根據起始骨架與參考分子的3D疊合進行打分。參考分子用于篩選衍生結果,保留潛在的生物活性分子,并去除無活性分子。參考分子可以是生物活性分子或藥物,其輸入方式與起始分子相同。定點衍生可以使部分子結構在衍生后保持不變,即衍生僅發生在特定位點。輸入的起始骨架顯示在JSME編輯器中后,通過單擊編輯器上方的藍色按鈕即可選擇需要在衍生后保持不變的原子。

    網站服務器——任務列表

    提交任務后,頁面將自動重定向到任務列表界面,可在此頁面查看任務名稱、開始時間和狀態等。用戶可以一次提交多個任務,后提交的任務將在隊列中等待之前的任務完成。用戶可以在任務完成后單擊任務名稱查看結果。通過單擊任務的“收藏”按鈕,該任務將被添加到收藏列表中。通過單擊頂部欄中的按鈕,用戶可以隨時訪問任務列表。

    網站服務器——輸出

    經過兩個階段的篩選,模型給出了最有前景的500個分子,同時這500個分子會與ChEMBL數據庫進行對比,那些出現在ChEMBL中的分子會被標記。對ChEMBL中分子的重現可以證明該模型生成活性分子的能力。對于結果中那些排名在ChEMBL重現分子之前的分子,用戶可以給予特別注意。因為這些分子在生物活性和ADMET特性方面可能比已知的ChEMBL分子更好,但尚未被報道。對于最終結果中的每個分子,輸出包括(1)2D結構和3D構象;(2)計算得到的QED值(越大表明類藥性越好);(3)合成可及性打分(越小越容易合成);(4)計算得到的分子屬性、官能團以及理化性質;(5)ADMET性質預測及對應概率;(6)疊合分數;(7)排序在該分子之后的重現ChEMBL分子。

    網站服務器——部署

    網站服務器托管在微軟云平臺上,使用Java和Python3開發,在Ubuntu操作系統上運行。硬件包括一個12核CPU,112G內存和2個用于加速的NVIDIA K80 GPU。此外還提供了離線部署解決方案,以保護知識產權。

    案例展示

    作者通過案例來說明如何使用該在線工具進行骨架衍生。以二苯甲烷作為起始骨架,選擇苯海拉明作為參考分子。輸入如圖3a所示。提交后,頁面會自動跳至任務列表界面,并顯示任務狀態(圖3b)。通過單擊任務名稱,將顯示衍生結果。在最終的500個分子中,有10個是ChEMBL中已經存在的。這10個分子的排序從第11到第476,表明該模型同時考慮了新穎性和生物活性。對于每個分子,可以查看預測的分子屬性。輸出如圖3c所示。(注:由于生成過程是通過從policy matrix中采樣來完成的,因此相同的輸入可能會產生不同的結果。這保證了所生成分子的多樣性)

    JCIM | AIScaffold: 基于深度學習的在線骨架衍生工具

    圖3. AIScaffold使用圖示:(a)任務輸入;(b)任務列表;(c)衍生結果

    圖片來源:J. Chem. Inf. Model.

    結論

    AIScaffold這一在線骨架衍生工具可以進行大規模的骨架衍生,基于圖的深度生成模型可以在幾分鐘內生成約五十萬個分子,在經過兩階段篩選算法后,將最有前景的500個分子提供給用戶,同時支持定點衍生等特性。大規模的衍生確保了搜索到的化學空間足夠廣,兩階段多模塊篩選確保最終推薦的分子具有理想的性質,高性能計算使用戶僅需幾分鐘即可查看結果。該工具可以簡化骨架衍生過程,從而加快藥物設計過程。除了基于參考分子的衍生外,基于靶點的衍生工具也正在開發,預計將在未來幾個月內可用。

    在線工具網址

    https://iaidrug.stonewise.cn

    參考文獻

    Lai, J., Li, X., Wang, Y., Yin, S., Zhou, J., & Liu, Z., AIScaffold: A Web-Based Tool for Scaffold Diversification Using Deep Learning. J. Chem. Inf. Model. 2020, ASAP.

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放