<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JMC | Atomwise利用深度卷積神經網絡發現新型關鍵腦酶抑制劑

    JMC | Atomwise利用深度卷積神經網絡發現新型關鍵腦酶抑制劑

    引言

    卡納萬病(CD)是一種罕見的疾病,這種疾病是由aspA基因突變引起的,該基因編碼了天冬氨酸?;?ASPA)。這些突變導致氨基酸取代,產生突變酶異構體的表達,從而導致了酶的不穩定或催化活性降低,導致關鍵腦代謝物N -乙酰- l-天門冬氨酸(NAA)的積累,并導致了少突膠質細胞中醋酸鹽的生產不足,從而會導致脂肪酸生物合成的減少和神經元的脫髓鞘。截至目前,由于缺乏有效的治療方法,CD仍然是一個致命并且無法治愈的疾病。

    先睹為快

    作者信息

    美國加州舊金山Atomwise公司、美國俄亥俄州托萊多大學化學與生物化學系

    Adrian Stecula、Ronald E. Viola

    靶點

    天冬氨酸N-乙酰轉移酶ANAT

    計算方法

    同源模建,深度卷積神經網絡AtomNet

    計算流程

    研究者基于低蛋白質序列同源性“模糊區域”的模板結構生成了同源模建模型,隨后篩選了商業化合物庫Mcule(約1000萬化合物)。去除分子量在100-800以外的,手性超過7個,以及可旋轉鍵大于16的分子,然后利用RDKit中的PAINS進行過濾,剩下7 177 223分子經過AtomNet(深度卷積神經網絡)打分,打分前20000的分子,選擇分子量大于200,并且不含對特定基團的化合物,隨后進行結構聚類,選擇743個代表性化合物,隨后在MolSoft ICM軟件中,按照molecular weight<550 Da, logP<7, PAINS score<0.6, toxicology score<2.5, “bad groups”= none進行過濾,選擇打分前111個化合物進行購買,其中60個化合物在DMSO中具有較好的溶解性,選擇這60個化合物進行實驗驗證高置信度預測的結合物的體外測試,從中發現了靶向ANAT的類藥性小分子抑制劑。

    過去幾十年里,絕大多數針對CD的治療方法的研究都集中在ASPA上。ASPA是一種有缺陷的酶,專門負責將NAA代謝成大腦中的天冬氨酸和醋酸鹽。最近的研究提供了令人信服的證據,證明導致CD癥狀的主要原因是腦內NAA水平升高,而不是無法產生下游代謝物。腦內NAA的合成是由nat8l基因編碼的天冬氨酸N-乙酰轉移酶(ANAT)催化的(圖1A)。敲除nat8l基因可以消除作為CD標志的大腦缺陷。免疫組織學和TEM成像顯示,沒有證據表明CD中存在廣泛的空泡化和脫髓鞘,NAA水平的降低減少了大腦皮層和小腦區域神經元的損失。盡管這些動物將NAA代謝成天冬氨酸和乙酸鹽的能力減弱,但發育缺陷的消除仍然發生,這是代謝的結果,也是大多數CD治療研究的焦點。通過降低NAA水平,不僅可以消除這些發育缺陷,而且行為和表現評估表明,與受損的卡納萬小鼠模型相比,這些缺陷有顯著改善。?

    JMC | Atomwise利用深度卷積神經網絡發現新型關鍵腦酶抑制劑

    圖1腦內NAA的代謝及同源模建構建的人ANAT模型

    圖片來源JMC

    當前,阻礙進一步研究CD患者NAA水平下降的影響的一個關鍵問題,是無法獲得ANAT和缺少工具化合物來探究這一途徑。與此同時,目前市場上還沒有FDA批準的ANAT抑制劑。目前已知的抑制劑是通過片段庫篩選確定的,隨后迭代優化產生該酶的第一個有效抑制劑。但由于細胞通透性和潛在毒性,臨床上并不受歡迎。在這里,研究者描述了一個新的方法可用于ANAT的靶向識別。研究者基于低于蛋白質序列同源性“模糊區域”的模板結構生成了一個比較結構模型,隨后使用AtomNet(深度卷積神經網絡模型)篩選了包含近1000萬化合物的現成商業化合物庫。經過體外測試發現了靶向ANAT的一類小分子抑制劑。

    AtomNet訓練

    AtomNet是第一個用于基于結構的藥物發現的深度神經網絡。使用幾百萬個小分子的生物活性值(例如Ki或IC50)和幾千個不同家族的蛋白質結構,以此訓練形成一個單一的全局AtomNet模型,用來預測結合親和力。

    訓練過程如下:

    1. 使用基于初始起始點的泛洪算法在給定的蛋白質結構上定義結合位點??梢酝ㄟ^多種方法來確定,包括RCSB PDB數據庫中標注的結合配體,誘變研究中發現的關鍵殘基,或文獻中報道的催化基序的鑒定。

    2. 將共復合物的坐標轉換為以結合點的質心為原點的三維笛卡爾坐標系。然后,通過圍繞結合位點的質心隨機旋轉和翻譯蛋白質來進行數據增強。

    3. 隨后,對于一個給定的配體,研究者在結合位點腔內對多個姿態進行采樣。每一個姿態都代表一個假定的協復合體,因此,與以往基于結構的預測方法(如對接)不同,該方法不需要實驗協復合體來進行訓練或預測。

    4. 然后將生成的每個共復合物柵格化為固定大小的規則三維網格,其中每個網格點上的值表示每個網格點上存在的結構特征,不同網格點表示不同的原子類型(或更復雜的蛋白質配體描述符,如SPLIF、SIFt以及APIF等)。這些網格作為卷積神經網絡的輸入,定義了網絡的接受域。研究者采用了一種輸入層間距為1 ?的30 × 30 × 30網格的網絡架構,隨后是六個依次是32 × 33, 64 × 33, 64 × 33, 64 × 33, 64 × 33, 32 × 23((濾芯數量×濾芯尺寸)的卷積層,最后是一個全鏈接層以及ReLU激活單位。每個姿態的得分會通過一個加權的波爾茲曼平均值進行組合,這個加權平均值會根據他們的預測得分對姿態進行加權。然后將這些分數與實驗測量的蛋白質和配體對的活性等級進行比較,并用二元交叉熵損失函數調整神經網絡的權重以減少預測和實驗測量的親和力之間的誤差。使用ADAM自適應學習方法、反向傳播算法和每梯度步長64個生物活性目標化合物對的小批量進行訓練。

    預測遵循一個類似的過程。研究者在靶蛋白上選擇一個正位或變位結合位點。接下來,對于給定的感興趣的分子篩選庫中的每個分子,生成一組結合位點內的位姿。每一個都由訓練過的模型打分,分子列表也根據它們的分數進行排序。然后,根據標準化的過濾協議、供應商的可用性和價格,研究者購買列表頂端的一組分子進行了實驗測試。該操作不會通過對化合物的視覺檢查而引入人工偏差。

    同源模建

    在項目開始的時候,還沒有公開的人類ANAT蛋白的結構。研究者使用SWISS-MODEL對模板結構的搜索表明,序列識別范圍在9% (PDB 編碼4RI1)到25% (PDB 編碼3PP9)之間存在許多同源結構。經過大量的分析研究,最終,研究者選擇PDB code 5T7E作為比較結構建模的模板,原因是結構中存在底物以及兩種蛋白的催化活性相似(圖1B)。人類天冬氨酸N-乙酰轉移酶依賴乙酰輔酶A作為乙?;w來執行其催化功能。該酶的催化區域預測為假設常見的Gcn5相關N-乙酰轉移酶(GNAT)折疊。利用PROMALS3D構建目標模板序列比對。對比結構模型在Molsoft ICM 3.8中使用完整的模型構建器模塊和完整的優化例程中建立而成,保留輔酶A和L-草丁膦分子作為剛體。人工檢查模型,確保側鏈原子沒有缺失時,添加氫,將輔酶A分子替換為PDB code 5T7D的乙酰輔酶A。以L-草丁膦分子為起始點,采用泛洪算法確定篩選位點。

    虛擬篩選過程?

    從一家化學品供應商(Mcule, https:// mcule.com)獲得約1000萬商用化合物。使用RDKit,去除鹽,規范化結構,去重。研究者還過濾了100和800 Da范圍之外的分子,包括那些包含超過7個手性中心的分子,以及大于16個可旋轉鍵的原子。最后,利用RDKit中實現的PAINs過濾器過濾所有剩余的化合物。剩下的7 177 223個分子由AtomNet在Amazon Web Service((https://aws.amazon.com)基礎設施上的一個由GPU和CPU組成的彈性混合集群上對目標進行打分。得分最高的且分子量 > 200 Da的2萬個化合物隨后被進一步過濾,使用一套專有的SMARTS模式進行過濾,其中包含類藥物化合物中通常認為不需要的部分(如冠醚、碳二亞胺)。剩余的化合物使用ECFP4指紋Tanimoto系數相似度截止值為0.3的Butina聚類算法進行多樣性聚類。最后一組743個集群被導入并在MolSoft ICM 3.8中采用以下標準:分子量小于550 Da, log P < 7、PAINS評分< 0.6,毒理學評分 < 2.5,不良基團=無。最后打分前111個分子作為代表性分子將用來購買。其中60個被發現可溶于DMSO,并通過了內部質量控制程序,這些化合物可供實驗驗證。

    實驗驗證

    實驗分析基于Viola實驗室開發的自定義協議。每一種購買的化合物都在1 mM的初始篩選中進行了測試。其中7種化合物顯示出了顯著的酶抑制作用,而60種化合物中約有一半在如此高濃度的條件下,即便在DMSO存在的情況下,溶解性仍然有限。第二次篩選的化合物是在50 μM濃度下進行的。實驗顯示,沒有一種化合物顯示出明顯的沉淀。在這個較低的濃度下,7個初始靶向物中的5個仍然被觀察到對酶有抑制作用。隨后在劑量反應方案中對這5種化合物進行了評估,每個化合物都在亞微摩爾范圍內顯示出Ki值。

    為了研究化合物的溶解度和聚集性,在低濃度洗滌劑的存在下重復了劑量反應實驗。當在該洗滌劑存在的情況下進行檢測時,每種化合物測定的抑制作用都有所改善,與不存在該洗滌劑時測定的值相比,Ki值提高了2- 4倍(表1)。

    JMC | Atomwise利用深度卷積神經網絡發現新型關鍵腦酶抑制劑

    圖2 化合物的結構(1-5)經AtomNet鑒定,并在體外驗證為ANAT抑制劑

    JMC | Atomwise利用深度卷積神經網絡發現新型關鍵腦酶抑制劑

    表1 靶向分子的分子性質

    展望與結論

    在這項研究中,研究者篩選發現了5個亞微摩爾級活性的天冬氨酸N-乙酰轉移酶抑制劑。這些化合物有潛力作為未來治療發現項目的起點。同時,研究者展示了AtomNet在具有挑戰性的約束條件下支持早期藥物發現的能力。首先,研究者證明了即使在目標數據稀缺或完全不可用的情況下,AtomNet仍然能夠發現新的活性骨架。其次,研究者證明了即使沒有三維晶體結構或高序列同源模板的可用性,發現類藥分子也是可能的。最后,研究者證明了在極其有限的資源下,研究新藥物也是可能的,機器學習可以幫助人類降低難度。在這項研究中,研究者從1000萬化合物中只購買并測試了60個化合物,深度學習的引入大大降低了化合物篩選的難度。

    參考文獻

    Stecula, A., Hussain, M. S., & Viola, R. E. (2020). Discovery of Novel Inhibitors of a Critical Brain Enzyme Using a Homology Model and a Deep Convolutional Neural Network. Journal of Medicinal Chemistry. DOI: 10.1021/acs.jmedchem.0c00473

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放