<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    主要內容

    近兩年來,新型乙型冠狀病毒SARS-CoV-2在全球迅速蔓延,在不到100天內確診病例超過150萬例。高感染率給全球衛生系統造成了相當大的壓力,截至撰寫本文時,已導致2.04多億人感染,430多萬人死亡。

    SARS-CoV-2大流行,促使人們開始在全球范圍內尋找治療方法,藥物再利用是加速這一過程的主要策略之一,因為有希望的藥物可能通過使用已批準的安全藥物,直接進入II期及以后的臨床研究。撰寫此文時(2020年初),大多數SARS-CoV-2體外抑制研究依賴于高通量篩選(HTS)研究來測試特定FDA批準的藥物,這些藥物和化合物此前對不同的β-冠狀病毒或特定的抗病毒靶點顯示出抑制作用。此后,已在Huh7細胞中大規模篩選了1425種化合物,確定了11種活性IC50?< 1 μM的分子。許多化合物已經進行了體外測試,因而獲得了一個不斷增長的體外抗病毒活性分子數據庫。機器學習模型,可以根據先前公布的數據預測最佳化合物,從而促進藥物發現。來自美國Collaborations Pharmaceuticals Inc的Sean Ekins等人采用了幾種機器學習方法,從最近的SARS-CoV-2體外抑制數據中開發預測模型,并使用它們從研究者的內部化合物庫中選擇FDA批準的化合物進行體外測試。從貝葉斯機器學習模型預測的化合物中,抗瘧藥lummefantrine被選中進行測試,并在基于細胞的檢測中顯示有限的抗病毒活性,同時通過微尺度熱電泳顯示與刺突蛋白結合(Kd =259nM)。這種機器學習和體外檢測相結合的方法,可以擴展到用虛擬篩選來尋找對SARS-CoV-2參考WIV04毒株有活性的化合物。相關的研究成果以?“Machine Learning Models Identify Inhibitors of SARS-CoV-2”?為題發布在國際著名期刊Journal of Chemical Information and Modeling上。

    與SARS-CoV-2刺突蛋白對接

    研究者利用Discovery Studio (Biovia, San Diego CA),基于COVID-2 Spike受體結合域(RBD)和血管緊張素轉換酶2 (ACE2)之間的晶體結構界面,選擇了一個區域進行對接。使用CDOCKER在該界面的受體腔生成的對接位點(半徑為9.7 ?)內,通過剛性對接在該界面生成lumefantrine的多個構象。對接參數設置為默認值(保留前10 的構象)。在配體最小化后,計算了化合物與受體之間的配體相互作用能。最小算法為“Smart Minimizer”,最大步長為1000步,最小均方根梯度為0.001,靜電球形截止距離為12 ?。

    數據管理

    體外SARS-CoV-2數據,從5項藥物再利用研究中經過初步整理,得到了包含63個分子的數據集,平均活性為15.94±22.45 μM。從不同研究中整理的外部測試集有30個分子,平均活性為34±42 μM。使用AC生成的貝葉斯模型對活性進行分類的閾值為6.65 μM,最終訓練集的活性化合物比例為52%,外部測試集為37%。數據集的活性分布如圖1所示。

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    圖1. SARS-CoV-2數據集的常見活性/非活性結構特征。圖片來源于JCIM

    機器學習模型

    本文涉及的機器學習模型是用AC以及其他幾種可用的機器學習方法開發的。五折交叉驗證比較結果顯示僅使用訓練數據實現的所有機器學習算法的不同預測統計量(表1)。在相同閾值6.65 μM下,AC優于所有其他方法,Rf緊隨其后。這些機器學習模型可用于外部驗證。

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    表1. 使用ECFP6指紋實現的所有SARS-CoV-2機器學習模型的五倍交叉驗證統計。表格來源于JCIM

    外部驗證

    機器學習模型對外部測試數據的性能,如表2所示。外部驗證使用來自訓練集之外的不同研究的數據來衡量模型性能。與其他機器學習模型相比,SVC和KNN的總體統計數據略好,在召回率和特異性之間達到了最佳平衡。

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    表2. 所有SARS-CoV-2機器學習模型的外部數據預測統計。表格來源于JCIM

    化學空間

    單獨對模型訓練集的主成分分析表明,使用分子指紋描述符分析時,SARS-CoV-2化學空間分布良好,活性分子和非活性分子混合良好(圖2)。與主要由FDA批準的藥物組成的Prestwick化學庫(PwCL)相比,SARS-CoV-2數據屬于具有分子描述符的大聚類,在使用指紋描述符時分布更為廣泛(圖2C,D)。

    JCIM | 機器學習模型識別SARS-CoV-2抑制劑

    圖 2. 具有分子描述符(A)和ECFP6的SARS-CoV-2集合的PCA (B)。紅色球體有活性,灰色球體無活性。SARS-CoV-2集合和PwCL的PCA與分子描述符(C)和ECFP6 (D)。紅色球體- SARS-CoV-2,灰色球體- PwCL。圖片來源于JCIM

    化合物的抗病毒活性測定

    最初選擇lummefantrine,是因為它是一種廣泛可用的抗瘧藥。作者在Vero 76、Calu-3和Caco-2細胞中進行了測試。與細胞毒性相比,每個細胞系的IC50EC90數據并不表明有用的體外活性(表3)。然而,Vero 76中性紅分析數據顯示,EC50遠低于CC50。Budesonide、tiamulin fumarate和tetrabenazine也在Caco-2細胞中進行了測試,并顯示了與細胞毒性相當的抑制作用。Tiamulin的EC90低于CC50。MST 測量lummefantrine對 SARS-Cov2 Spike RBD 蛋白的結合親和力,結果如圖3所示。

    表3. Lumefantrine Vero 76、Calu-3和Caco-2的IC50、EC90CC50值。表格來源于JCIM

    圖3. Spike RBD與lummefantrine相互作用的MST結合分析。圖片來自Journal of Chemical Information and Modeling

    結論總結

    本文證明了作者提出的機器學習模型,在內部交叉驗證和外部驗證中表現良好。機器學習使人們能夠找到自己或他人驗證的SARS-CoV-2的活性分子。這些機器學習模型還可以用來優先考慮未來的化合物,這些化合物的預測得分和可靠性都很高。這將有望反饋更可靠的預測,同時結合藥物發現專業知識便可以幫助確定體外測試的化合物的優先級。

    參考文獻

    Victor O. Gawriljuk, Phyo Phyo Kyaw Zin, Ana C. Puhl, Kimberley M. Zorn, Daniel H. Foil, Thomas R. Lane, Brett Hurst, Tatyana Almeida Tavella, Fabio Trindade Maranh?o Costa, Premkumar Lakshmanane, Jean Bernatchez, Andre S. Godoy, Glaucius Oliva, Jair L. Siqueira-Neto, Peter B. Madrid, and Sean Ekins, Machine Learning Models Identify Inhibitors of SARS-CoV-2, Journal of Chemical Information and Modeling Article ASAP. DOI: 10.1021/acs.jcim.1c00683

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放