<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    Science | 真核蛋白復合體的核心結構的計算

    Science | 真核蛋白復合體的核心結構的計算
    Science | 真核蛋白復合體的核心結構的計算

    一個協同進化導向的蛋白-蛋白相互作用識別管道,將RoseTTAFold的速度和AlphaFold的精度結合,系統性地評估了830萬對酵母蛋白之間的相互作用。

    背景介紹

    酵母雙雜交(Y2H)、親和純化質譜(APMS)等高通量實驗方法,已在酵母和其他生物中鑒定出許多對相互作用蛋白,但使用不同方法產生的數據集存在差異,且有相當高的假陽性率和假陰性率。由于蛋白-蛋白界面的殘基預計會協同進化,所以任何兩個蛋白相互作用的可能性可以通過pMSAs來評估,即識別和比對兩個蛋白在許多不同物種中的同源序列并將其連接起來,創建成對的多重序列比對(pMSAs)。然后確定第一個蛋白的同源序列的變化與第二個蛋白的同源序列的變化協方差。氨基酸協同進化已經被用于指導伴侶蛋白結構已知的復合體的建模,并系統地識別在原核生物中相互作用的蛋白質對,比實驗篩選的準確性更高。

    最近深度學習在蛋白結構預測方面的進展有可能增強這類方法的能力,因為它們現在能夠對蛋白質單體結構甚至蛋白-蛋白復合物進行精確建模。

    主要內容

    本文中,來自美國得克薩斯大學達拉斯分校的Qian?Cong和 美國華盛頓大學的David Baker等人,利用蛋白質組內氨基酸協同進化分析和基于深度學習的結構建模的進展,系統地識別建立釀酒酵母蛋白質組內核心真核蛋白復合體的精確模型。研究者將RoseTTAFold和AlphaFold結合,對830萬對酵母蛋白進行多序列比對篩選,識別出了1505對可能有相互作用的酵母蛋白,并為106個以前未識別的裝配體和806個尚未描述結構特征的裝配體建立了結構模型。這些復合體有多達5個亞基,在真核細胞幾乎所有的關鍵過程中發揮作用,并提供了對生物功能的廣泛見解。相關的研究成果以“Computed structures of core eukaryotic protein complexes”為題發布在國際頂級期刊Science上。

    蛋白-蛋白相互作用和結構預測的準確性的評估

    研究者著手將蛋白質組廣泛的協同進化指導的蛋白質相互作用識別與基于深度學習的蛋白質結構建模相結合,以系統地識別和確定真核蛋白質組裝體的結構(圖1A)。

    目前,主要存在以下挑戰:

    1. 首先,真核生物的基因組序列比原核生物少得多:細菌蛋白質的平均同源序列數在10,000左右,而真核生物蛋白質在1000左右。

    2. 其次,真核生物通常有更多的基因,使得全面的成對分析計算量更大,背景噪聲也更多。

    3. 第三,真核生物的mRNA剪接進一步增加了蛋白質種類的數量,可能導致錯誤的基因預測和復雜的序列比對。

    4. 第四,真核生物在多個譜系中經歷了幾輪基因組復制,很難從旁系同源中區分出直系同源,而這對檢測協同進化的信號很重要,因為感興趣的蛋白質相互作用可能保存在其他物種的直系同源中,但在旁系同源中保存的較少。

    為了應對挑戰,研究者以預測釀酒酵母的蛋白質復合體為起點,因為真菌基因組數量眾多,基因組相對較小(共6000個基因),mRNA剪接相對較少。

    對于大約6000個酵母蛋白中的4090個,研究者能夠將一個單拷貝酵母蛋白分配給其他物種的直系同源蛋白,并生成了這些蛋白的4090×4089/2 = 8,362,005對組合的pMSAs。研究者專注于4,286,433對比對(包含超過200個序列)以提高預測精度,小于1300個氨基酸以加速計算。

    在第一組計算中,研究者發現:即使有釀酒酵母和改進的直系同源識別的優勢,之前在原核生物中使用的協同進化導向PPI篩選的統計方法(DCA)也無法有效地將768對已知相互作用的酵母蛋白對的金標準組與768000對基本不相互作用的酵母蛋白對進行區分(圖1B灰色曲線,曲線下面積:0.016)。

    因此,研究者探索了基于深度學習的結構預測方法RoseTTAFold (RF)和AlphaFold (AF)的應用。這種方法在區分金標準相互作用和隨機對方面明顯優于DCA(圖1B藍色曲線,曲線下面積:0.219),使用兩個蛋白質中所有殘基對的最高預測接觸概率作為兩個蛋白質相互作用傾向的度量。通過修正第一個蛋白質的C-端殘基與第二個蛋白質的N-端殘基之間的預測接觸概率的過高預估,以及對一個顯示與許多其他蛋白質具有樞紐狀相互作用的蛋白質子集的預測相互作用,進一步提高了性能(圖1B綠色曲線,曲線下面積:0.248)。

    Science | 真核蛋白復合體的核心結構的計算

    圖 1. 蛋白-蛋白相互作用和結構預測的準確性的評估。圖片來源于Science

    研究者進一步研究了AF殘基-殘基接觸預測,能否進一步區分相互作用和非相互作用的蛋白質對。AF太慢,無法應用到430萬對pMSAs中(這將需要10萬到100萬圖形處理單元(GPU)小時);相反,AF可以應用于具有最高RF支持的5495個蛋白質對(如圖1B中的黑色豎線)。使用所有殘留物對中最高的AF接觸概率作為相互作用強度的測量標準,研究者發現RF和AF的組合提供了優異的性能(圖1C)。幾乎所有的金標準對的排序都高于陰性對照,選擇的一組715個候選PPIs在AF接觸概率的截止點為0.67(圖1C中的黑色水平線),預期精度為95%。

    鑒于AF在區分RF濾波對之間的金標準相互作用方面的優異性能,作者還將AF應用于pMSAs,PPIs來自于在文獻中報道的PPIs(包括在高通量實驗篩選中識別的)。研究者發現47%的黃金標準PPIs是預測可信的,根據BIOGRID的低通量實驗,候選PPIs的比例較低(31和24%)。

    最終,研究者從“從頭RF→AF”流程中共鑒定出715對可能的相互作用對,從“混合實驗集→AF”流程中共鑒定出1251對,去掉重合的共鑒定出1505個PPIs。其中699個已經進行了結構表征,700個從文獻和數據庫中獲得了一些實驗支持的數據,據目前所知,剩下的106個此前還沒有實驗描述過。為了評估預測的蛋白質復合體三維結構的準確性,研究者將PDB中的699對實驗結構作為基準。對于92%的蛋白對,至少有50%(預測對齊誤差<8 ?) AF-預測接觸出現在實驗結構中(圖1E)。

    每個功能類復合體的范例

    基于以上基準結果,研究者對新的復雜交互預測和預測復合體的3D模型的準確性有了初步的信心。接下來對806個復雜復合體的結構模型進行了分析,這些復雜復合體的高分辨率結構信息目前尚無法獲得。研究者根據它們的生物功能,將這些模型進行了分組,并提供了每個功能復合體的范例。

    1. 第一組復合體涉及遺傳信息的維護和處理:DNA修復、有絲分裂和減數分裂檢查點、轉錄和翻譯。

    Science | 真核蛋白復合體的核心結構的計算

    圖 2. 參與轉錄、翻譯和DNA修復的蛋白質復合體。圖片來源于Science

    2. 第二組復合體在蛋白質轉運、通過分泌途徑轉運、細胞骨架和細胞器中發揮作用。

    Science | 真核蛋白復合體的核心結構的計算

    圖 3. 參與分子轉運、膜轉運和線粒體的蛋白質復合體。圖片來源于Science

    3. 第三組復合體參與新陳代謝。圖4顯示了功能未知的蛋白與特征良好的蛋白相互作用的蛋白-蛋白復合體的范例:這些相互作用為未表征蛋白的功能提供了線索,并有助于識別先前表征的組裝體的新組件。?

    Science | 真核蛋白復合體的核心結構的計算

    圖 4. 參與代謝、GPI(糖基磷脂酰肌醇)錨定生物合成的蛋白復合體,或包括功能未知的蛋白質。圖片來源于Science

    在預測三個或更多蛋白質相互作用的情況下,研究者通過使用整個復合體的序列比對作為輸入,生成了完整組裝的模型。這些大型裝配的示例如圖5所示;在大多數情況下,成對的相互作用與獨立構建的二元復合體非常相似,但是整個復合體的同時建模的優點是允許伴隨完整組裝的構象變化。

    Science | 真核蛋白復合體的核心結構的計算

    圖 5. 高階蛋白復合體。圖片來源于Science

    結論總結

    本文提出的方法將基于深度學習的大規模結構建模的范圍從單體蛋白質擴展到了蛋白質組裝。正如上面的范例所強調的,對這里提出的許多新復合體的跟蹤,將促進對廣泛的真核細胞過程的理解,并為治療干預提供新的靶點。

    在蛋白質復合體上訓練RF和AF,可以進一步提高這兩種方法的性能,特別是對于同源性較少和/或相互作用較弱和較短暫的蛋白質對,并減少對同源性鑒定的依賴。結合單體結構預測的進展,該研究結果預示著一個新的結構生物學時代的到來,在這個時代中,計算在相互作用發現和結構確定中起著基礎性的作用。

    參考文獻

    Humphreys, Ian R., et al. “Computed structures of core eukaryotic protein complexes.”?Science?374,?eabm4805 (2021).?DOI: 10.1126/science.abm4805

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放