<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!
    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    背景介紹

    設計變構調節劑,需要先了解蛋白質的哪些部分可以與配體實現高親和力結合。然而,這是一項艱巨的任務,尤其在結合位點處于“隱藏”的情況下,將會變得更加困難。所謂“隱藏”位點(以下簡稱隱位點),指的是一些有配體與之結合時明顯,但沒有配體時難以檢測的位點。因此,當人們在蛋白質上找到一個隱位點時,可能并不能保證該蛋白質是可藥的。此類藥物設計領域關注的隱位點,它也必須是變構的:結合位點的構象必須影響蛋白質的功能。盡管如此,發現隱藏口袋的能力,還是為藥物設計開辟了另一種有前景的途徑。

    當前,為了研究結合位點(包括隱型和非隱型),人們已經開發了各種算法,如:

    1.基于分析分子動力學(MD)模擬,如EPOCK、POVME和TRAPP等。盡管這些算法對于表征已知袋的行為是有用的,但是它們對結合袋位置先驗知識的依賴,制約了它們在未被充分研究的蛋白質上的應用。

    2.以靜態結構(例如PDB文件)作為輸入,如LIGSITE、KVFinder、COACH、COFACTOR、ConCavity、FPocket、galaxsite、ghecom、DoGSite和FTMAP等,雖然使用單一的結構可以減少計算時間,但很難找到存在于所有構象中的隱蔽位點。雖然這些程序非常強大,但它們需要專門的模擬,這就阻止了它們在預先計算的軌跡上的使用。

    3.EPOSBP, trj_cavity, MDPocket, D3Pockets和NanoShaper都是基于幾何的口袋發現器,但它們忽略了物理化學性質,而且都有自身的局限性。

    4.CryptoSite采用了一種不同的方法,它在算法中不使用探針計算自己的MD軌跡。然而,該程序要求用戶定義感興趣的區域,限制了對缺乏任何關于隱位點位置信息蛋白質的適用性。

    當前的每一種策略都有自己的局限性,缺乏通用性。而機器學習(ML)在復雜數據中發現趨勢的能力,使其成為預測小分子結合位點這一重要任務的一種有前景的技術。機器學習具有顯著改善結合位點預測的潛力,包括預測晶體結構中不存在的隱袋。因此,將ML和其他尖端計算技術應用于結合位點的預測,將對藥物設計過程產生重大影響。

    主要內容

    基于結構的藥物發現工作,需要了解藥物結合位點在靶蛋白上的位置。為了解決尋找可用藥位點的挑戰,來自美國約翰·霍普金斯大學的Albert Y. Lau等研究者,開發了一種名為TACTICS的機器學習算法(基于軌跡的構象分析,以識別隱蔽位點),它使用一個分子結構集合(如分子動力學模擬數據)作為輸入。首先,TACTICS使用k-均值聚類選擇少量構象,這些構象代表數據的整體構象異質性。然后,基于蛋白質運動和幾何學,TACTICS使用一個隨機森林模型來識別每個選定構象中潛在的可結合殘基。最后,使用片段對接對潛在結合口袋中的殘基進行評分。相關的研究成果以?“Finding Druggable Sites in Proteins Using TACTICS”為題發布在國際著名期刊Journal of Chemical Information and Modeling上。

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    圖 1. ?TACTICS的設計。圖片來源于J. Chem. Inf. Model

    為了演示TACTICS的能力,研究者將該算法應用于三個蛋白質中,分別是SARS-CoV-2蛋白質(主要蛋白酶和甲基轉移酶),以及芳基載體蛋白。結果如下:

    1.?SARS-CoV-2主要蛋白酶

    SARS-CoV-2主要蛋白酶(M-pro;nsp5),負責切割病毒RNA基因組翻譯產生的多蛋白。由于該蛋白的配體結合特性已經得到了較為充分的研究,M-Pro是檢驗TACTICS重新發現已知結合位點能力的一個很好的選擇。

    TACTICS識別出主要蛋白酶活性位點。在模擬的各個點上,TACTICS識別出殘基,包括H41、F140和H163。結合位點,如圖2A和B等所示。在圖中結晶配體的左側,TACTICS識別出其他殘基為可用藥殘基。因為TACTICS的設計重點是,尋找隱蔽的位點并盡量減少誤報,所以它使用ml_std_thresh過濾掉分數不變的殘差。

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    圖2. 從TACTICS的輸出中為SARS-CoV-2主要蛋白酶選擇的圖像。圖片來自J. Chem. Inf. Model

    TACTICS還在主要蛋白酶上,確定了一個已知的變構位點。一個配體在PDB ID 5RGJ的這個位點結晶;雖然晶體結構有一個配體結合到每一個二聚體的前聚體,這兩個配體彼此是非常接近的。這種配體已被證明,可以降低蛋白酶的活性。結合位點,如圖2C和D等所示。在所示的構象中,口袋比容納來自5RGJ的配體所需的要大。因此,更大的配體,可能會結合到這個位點上。

    二聚體界面,是TACTICS識別的另一個潛在藥物靶點。PDB ID 5RFA有兩分子的化合物x1187,結合在二聚體界面上。每個分子都與兩個原聚物相互作用。實驗結果表明,x1187抑制了二聚體和蛋白酶活性,證實了二聚體界面的重要性。

    2.?SARS-CoV-2 2′-O RNA甲基轉移酶

    在COVID-19大流行期間,有希望的藥物靶點之一是SARS-CoV-2 2 ‘ -O RNA甲基轉移酶(MTase)。該酶負責RNA帽的形成,這是病毒RNA入侵的關鍵。在這里,研究者使用REST2對SARS-CoV-2 MTase的構象空間進行有效采樣,利用TACTICS識別已知和隱型結合位點。

    TACTICS在識別距離nsp10最遠的結合位點和催化位點方面最為成功。除了識別已知的與RNA結合的殘基外,TACTICS還識別了RNA結合袋中包含其他殘基的構象。在某些構象中,在螺旋α9和α10之間的環中的某些殘基(殘基235-241)包含在口袋中;關鍵殘基包括N235、P236和I237。L27和S202對于控制擴展口袋的訪問尤為重要,圖3C和D等顯示了這個擴展口袋。

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    圖3. TACTICS定位MTase RNA結合位點,并預測與之相連的口袋。圖片來自J. Chem. Inf. Model

    在另一種構象中,RNA結合袋包括L27、Y222和H225;這種構象如圖3E和F等所示。Folding@Home識別了TACTICS預測位點附近的殘基;Folding@Home鑒定的殘基,包括R19-D26和K137 F152??梢韵胂?,結合這些殘基的配體,可以部分填充RNA位點;配體誘導的鄰近區域的構象變化,也可能影響RNA位點的結合能力。

    TACTICS識別SAM結合位點,如圖4A和B所示。TACTICS識別了殘基D99和D130,它們都與競爭配體Sinefungin形成氫鍵。TACTICS還發現了一些附近的殘基,包括G71、M131和Y132等。應當注意的是,TACTICS在相對較少的幀中,發現SAM結合殘基。這可能表明了TACTICS在尋找特定類型口袋方面的能力局限性。

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    圖4. TACTICS在MTase中發現了其他已知和預測的結合位點。圖片來自J. Chem. Inf. Model

    TACTICS預測nsp10在nsp10/16接口上的結合位點,位點如圖4C和D等所示。nsp10上的潛在重要殘基,包括S72、C74、Y76、T111、L92,而nsp16上的潛在重要殘基,包括V78、S105和D106。

    除了在二聚體界面上的位點,TACTICS還識別了另一個可能通過變構抑制破壞活性的位點。新的預測結合位點如圖4E和F等所示。它位于RNA結合位點的另一邊,潛在的重要殘基,包括K123、L163、Q266、R283和E284。

    3.?芳基載體蛋白(ArCP)

    ArCP沒有活性位點,也沒有已知的小分子結合位點(除了PP臂)。雖然它有已知的蛋白質結合位點,但蛋白質-蛋白質結合位點與配體結合位點有很大的不同。

    在apo-ArCP中,TACTICS預測了兩個結合位點。一個預測位點涉及螺旋α1和α2,如圖5A和B等所示。α1上的潛在可結合殘基,包括Q23、R27和E31,而α2上的關鍵殘基,包括R54、R57和W61。

    JCIM | 尋找蛋白中的可藥位點?用TACTICS!

    圖5. TACTICS輸出顯示apo-ArCP的預測結合位點。圖片來自J. Chem. Inf. Model

    另一個預測位點位于N和C端附近。位點非常靈活,觀察到各種構象。在一個構象中(圖5C和D等),該位點包括α1殘基H17、D20和Y21,以及α4殘基M87、L88和E93。在另一個構象中(圖5E和F等),該位點包括α1殘基R16、H17和D20, α4殘基S91和P92,以及loop2(在α2和α3之間)殘基Y67。在第三種構象中(圖5G、H和S12),該位點包括α1殘基D14、H17、A18和Y21,以及α4殘基N84、Q85和L88。

    在holo-ArCP中,TACTICS預測了N和C端形成的結合位點,該位點如圖6A和B等所示。該位點與“Apo 2”位點的位置相同;apo和holo結果的對接得分和構象靈活性非常相似。TACTICS還預測了一個主要位于loop1 (α1和α2之間)上的結合位點,它包括殘基L39、H40、S43和A48。

    圖6. TACTICS對holo-和loaded-Arcp中結合位點的預測。圖片來自J. Chem. Inf. Model

    在loaded-Arcp中,TACTICS預測了包含螺旋α4和loop2(在α2和α3之間)的結合位點,該位點如圖6C和D等所示。螺旋α4上潛在的重要殘基,包括L86, M87和R90。在loop2上可能重要的殘基,包括Y67和R68。TACTICS還預測了loaded-Arcp的另一個結合位點,該位點如圖6E和F等所示。預測位點,包括loop1(在α1和α2之間)、α2和α3中的殘基。在loop1和α2上可能重要的殘基,包括I46、L50、s52-pp-salicylate arm和L55。Y75是α3上潛在的重要殘基。

    圖7. SARS-CoV-2 M-Pro前20 ns口袋預測的比較。圖片來自J. Chem. Inf. Model

    結論總結

    本文章介紹了TACTICS算法,通過分析MD模擬,來尋找蛋白質中的藥物位點。TACTICS首先將軌跡聚集起來,選擇幾個幀進行分析。然后,對每個選定的幀應用隨機森林ML模型。該模型取一個蛋白質構象,并在該構象中對每個殘基的成藥性進行評分。該模型在晶體結構數據庫上進行訓練;為了捕獲構象多樣性,每個蛋白質包含多個結構。由ML算法識別的位點經過片段對接以進一步表征其可結合性。

    目前,TACTICS是唯一一個既可使用專門為MD軌跡設計的ML模型,又可接受已生成的MD數據的免費程序。TACTICS公開訪問地址:https://github.com/Albert-Lau-Lab/tactics_protein_analysis。

    參考文獻

    Daniel J. Evans, Remy A. Yovanno. et al. Finding Druggable Sites in Proteins Using TACTICS. Journal of Chemical Information and Modeling 2021 61 (6), 2897-2910. DOI: 10.1021/acs.jcim.1c00204

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放