<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具
    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    CS-Annotate的核心是一種多任務深度學習模型的運用,可以同時從化學位移指紋中對溶劑暴露、堿基堆積和配對狀態以及單個RNA殘基構象進行分類。

    背景介紹

    NMR化學位移對分子中的局部電子環境很敏感,因此它們可以作為結構指紋。從化學位移中直接提取生物分子的結構特性一直是結構生物學的一個長期目標,但從化學位移數據中直接提取RNA結構特性的類似方法受到的關注較少。

    本文作者訓練了一個單一、多任務分類器,將RNA殘基中不可交換的1H13C化學位移作為輸入,輸出其溶劑暴露、相鄰堆積、不相鄰堆積或堿基配對的概率,這些是六種糖褶狀態之一或是syn或anti構象。通過名為CS-Annotate的web服務器來公開多任務分類器,該服務器使用化學位移形成分類評分來注釋RNA中單個殘留物的結構屬性。文章簡要描述了如何訓練和測試分類器,并演示了模型在RNA系統中的應用。

    CS-Annotate在線訪問地址

    https://smaltr.org/

    演示視頻地址

    https://youtu.be/ZfpxLe46SvE

    網站首頁:

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    圖1是對11個任務進行訓練的漸進神經網絡(PNN)模型的演示,每個任務都有兩個隱藏層。用于訓練多任務分類器的數據集由104個RNA的化學位移和結構數據組成?;瘜W位移及原子結構信息分別從BMRB和PDB得到。使用 MC-Annotate 確定每個 RNA除溶劑暴露外的所有結構特性。用POPS 計算殘基溶劑可及表面積 (SASAs)。如果殘基的 SASA 大于整個訓練集的 SASA 值的平均值加上標準差 (SD) 的一半,則將殘基定義為溶劑暴露。然后將與單個殘基和相鄰殘基相關的化學位移數據與其注釋特性相結合,形成化學位移結構數據集。訓練集有 3068 個樣本,測試集有 129 個樣本。?

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    圖1 漸進神經網絡(PNN)模型演示。圖片來源:JCIM

    模型結果

    為了評估PNN是否能從化學位移特征中同時注釋RNA中單個殘基的11個結構屬性,作者對訓練集數據進行了五折交叉驗證(表1)。

    11個任務的平衡精度(balance accuracy)從0.555到0.812不等,均值為0.708,強于多個基線模型。使用整個訓練集對PNN進行再訓練,并在三個測試RNA的殘基的測試集中驗證其性能。分類器的性能在訓練集上的表現符合交叉驗證結果:平衡精度介于0.508和0.971之間,均值為0.734。糖折疊模式的預測精度比其他屬性的低。

    表1 漸進多任務分類器的平衡精度。表格來源:JCIM

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    在氟化核糖開關上的應用

    圖2a所示的是作者的多任務分類器在應用于氟化物核糖體開關的適配體結構域時得到的注釋圖。與NMR結構相比,在10個溶劑暴露概率最高的殘基中有7個確實是高度暴露(其殘基SASA>200 ?2) (圖2b)。除了G4之外,所有被預測為鄰接堆積的殘基都得到了正確的分類(圖2c)。然而,一些殘基(例如,U12、C13、A21、C22、U35、A37、C44、U45和U47)被誤歸類為不鄰接堆積,表明該分類器對該任務的敏感性低于特異性(表1)。出乎意料的是,該分類器還能注釋幾個非鄰接殘基。例如,G4、A5、G10、A17、G23、A36、G39都表現出較高的非相鄰堆積分類得分,也確實參與了非相鄰堆積相互作用(圖2d)。

    對于單個殘基的堿基配對狀態,U6、A46、U47被誤分為堿基配對,U12、C41、A42、C43、C44被誤分為未配對(圖2e)??偟膩碚f,該多任務分類器找回了氟化核糖開關中大多數殘基的堿基對狀態。氟核糖開關中大部分殘基的糖苷扭轉(χ)處于anti構象,syn構象的G30、high-anti構象的A19、U28和A37除外。有趣的是,這些是分類器預測的最有可能是syn的四個殘基(圖2f)。在糖褶方面,除A17、U18、A19、U28、C29和A37六個殘基外,氟核糖開關中大部分殘基為3’-endo糖褶構象。這6個殘基,以及A20、A21和C22,被多任務分類器預測為最不可能(p<0.10)處于3’-endo構象的殘基(圖2a)。根據相對糖褶分類分數,A17和U18被正確識別為更有可能為2’-endo(圖2g),盡管它們的絕對分類分數較低(p~0.31;圖2a)。

    JCIM | CS-Annotate:用化學位移注釋RNA結構的深度學習在線工具

    圖2氟化核糖開關的適配體結構域化學位移生成的注釋。圖片來源:JCIM

    CS-Annotate的限制

    正如在上述氟核糖開關中的應用,作者訓練的多任務分類器可以基于一組指定的化學位移來注釋RNA中的多個結構特性。因此,他們將模型部署到一個稱為CS-Annotate的工具中。CS-Annotate將RNA分配的化學位移以格式化的文本文件輸入到模型中,然后將輸入的化學位移傳遞給分類器,然后返回一個圖形注釋圖(圖2a)和一個包含殘基預測的文本文件。

    CS-Annotate的一個限制是,因為訓練分類器使用化學位移i?3、i ?2、i?1、i、i+1、i+2和i+3來估計殘基的性質,它的預測只有在無分配間隙的情況下才有意義,即對RNA中每個殘基中一些不可交換的1H和1C原子有指定的化學位移。

    為了與基于結構的注釋工具如MC-Annotate所使用的糖褶分類方案一致,CS-Annotate輸出了許多糖褶狀態預測。然而,在某些情況下,用戶可能會對更粗粒度的預測很感興趣。為了實現這一點,用戶可以對CS-Annotate的預測進行粗?;?,例如,將殘基分類為C3-endo。

    最后,作者注意到PNN分類器是與順序相關的。其對目標順序的選擇[即,哪個任務是第一個,哪個任務是第二個]是任意的。鑒于多任務分類器的11個目標的組合有3900萬種。因此,他們并沒有探索這個巨大的“超參數”空間。

    盡管有這些警告,作者設想CS-Annotate可以作為一種工具,在研究的主要焦點不是確定3D結構的情況下(例如,在進行機制研究時),或者在無法獲得通常用于通過NMR解析RNA結構的數據的情況下(例如,當研究RNA的瞬態時),從NMR化學轉移實例生成可靠的結構假設。

    結論

    作者訓練了一個多任務分類器,它從一組分配的化學位移中分類RNA中的11個殘基結構屬性,并將該分類器置于CS-Annotate工具中。使用CS-Annotate,用戶將能預測溶劑暴露、相鄰/非相鄰的堆積相互作用、堿基對狀態、糖苷取向和糖褶狀態。CS-Annotate將是RNA詳細結構分析的有用工具,并與其他預測建模工具一起,用于檢測RNA中的化學轉移結構關系。

    參考文獻

    Zhang K, Abdallah K, Ajmera P, Finos K, Looka A, Mekhael J, Frank AT. CS-Annotate: A Tool for Using NMR Chemical Shifts to Annotate RNA Structure. J Chem Inf Model. 2021 Apr 26;61(4):1545-1549. doi: 10.1021/acs.jcim.1c00006. Epub 2021 Apr 2. PMID: 33797909.

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放