<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜
    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    一種整合了所有在BioPlex中親和純化后的人類蛋白圖譜免疫熒光圖像,進而創建了人類細胞結構的統一層次圖譜,即MuSIC。

    背景介紹

    真核細胞由細胞器等大組件組成,而細胞器又可分解成冷凝物和蛋白質復合體等小組件,形成復雜的多尺度結構。繪制亞細胞結構的基本技術有蛋白質成像和生物物理關聯,且每一種都實現了自動化。尤其是共聚焦顯微鏡和免疫熒光技術的進步,使得掃描單個細胞內原位蛋白質的分布成為可能。通過將這些技術與抗體庫相結合,人類蛋白圖譜(Human Protein Atlas, HPA)已經開始系統地將人類蛋白質研究定位于亞細胞區室。作為一種并行的細胞定位方法,質譜(MS)與親和純化(AP-MS)和鄰近依賴標記強有力地結合在一起,使蛋白-蛋白相互作用的快速測量成為可能。利用AP-MS, BioPlex項目正在為大多數人類蛋白質生成全面的相互作用圖譜。

    一個關鍵問題是:如何將成像和生物物理關聯結合起來以展示細胞結構。圖像定位蛋白質相對于細胞核等細胞標志,而生物物理關聯則是將蛋白質相對于鄰近蛋白進行定位。在這兩種情況下,由于機器學習系統在數據中識別復雜模式的能力,使得這種定位變得越來越定量化。

    主要內容

    本文中,來自瑞典斯德哥爾摩皇家理工學院及美國斯坦福大學的Emma Lundberg和美國加州大學圣地亞哥分校的Trey Ideker等人演示了一種機器學習方法,將蛋白成像和生物物理關聯集成在一起,以創建亞細胞組件的統一圖譜(圖1)。首先,研究者使用神經網絡在成像或生物物理關聯的基礎上,將蛋白質投射到低維度。一旦確定了每個平臺的蛋白質坐標后就對蛋白間的兩兩距離進行校準和組合,以顯示不同尺度下(從小于50 nm到大于1 μ m)的蛋白質組合。相關的研究成果以“A multi-scale map of cell structure fusing protein images and interactions”為題發布在國際頂級期刊Nature上。

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    圖 1. 數據融合策略概述。圖片來源于Nature

    兩種方式的蛋白質的位置和距離

    研究者收集了來自HPA的免疫熒光圖像和來自BioPlex的AP-MS數據的匹配數據集。這兩種資源都是基于人類胚胎腎(HEK293來源)細胞,共產生了661個蛋白質,具有兼容成像(1451張圖像包括復制)和生物物理關聯數據(291個蛋白質親和標記為“誘餌”,370個蛋白作為相互作用的“獵物”)?。

    接下來研究者根據免疫熒光和AP-MS數據,使用深度神經網絡嵌入每個蛋白。嵌入是復雜輸入的一種低維表示,其中每個數據點(這里是蛋白質)都被賦值為降維坐標。在圖像嵌入中,研究者使用了卷積神經網絡——DenseNet,其在捕獲相對于反染色細胞標志物的蛋白位置方面具有優越的性能。類似地,使用node2vec神經網絡擴展的AP-MS鄰近交互來嵌入每個蛋白質。

    然后,研究者分別在免疫熒光和AP-MS嵌入中計算所有蛋白對的距離。研究者組裝了已知或估計直徑的亞細胞組分參考集,包括了從小于20 nm的蛋白質復合物到大于1μm的細胞器。利用這些經過篩選的直徑作為訓練標簽,作者訓練了一個有監督的機器學習模型(隨機森林回歸),直接從免疫熒光和AP-MS嵌入的坐標中估計任意蛋白質對的距離。

    亞細胞系統的多尺度圖譜

    研究者分析了661個蛋白質之間的所有距離以識別相互接近的蛋白群落,這些群落表明不同的組件(圖2)。隨著閾值的放寬,較小距離的群落被完全或部分地包含在較大的群落中,從而產生一個結構層次(圖3a)。這樣可以觀察到廣泛的群落檢測參數,且與大小型群落都一致的獨立數據集。最終的層次結構,即MuSIC 1.0,它包含69個蛋白質群落,代表了有87個層次包含關系的假定的亞細胞系統(圖2)。16個系統包含在多個較大的系統中,表明了多個亞細胞定位或多向性。

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    圖 2. 多尺度集成單元。圖片來源于Nature

    ?

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    圖 3. MUSIC捕獲的亞細胞組件和直徑。圖片來源于Nature

    MuSIC系統的物理尺寸是根據它們的配對蛋白質距離估算的(圖2),并與9個先前未在校準中使用的特征良好的細胞組分的已知直徑進行了比較(圖3b)。其中一個組分是催化剪接體,免疫熒光和AP-MS數據支持(圖3c-f)誘導的蛋白群落為48 nm(95%預測區間[26,90]),與其公布的直徑42 nm(圖3a, g)一致。在該群落內,分析解決了較小的U1和U2子單元(U1: 8 nm, 95%預測區間[4,15];U2: 33 nm, 95%預測區間[17,61]),同樣與低溫電子顯微鏡測量的排列和距離一致(圖3g)。對于所有9個組件,估計的直徑與文獻中的實際測量值非常接近(圖3b),驗證了MuSIC可以捕獲和測量大尺度生物系統。

    MuSIC需要并告知這兩種數據類型

    研究者發現,大多數系統對數據的輕微破壞都是健壯的(圖4a,刀切重采樣)。相比之下,僅使用一種數據類型構建的替代MuSIC圖譜則會丟棄許多系統。免疫熒光圖譜傾向于識別大型系統,如細胞器;但對小的亞組分,如蛋白質復合體則不確定,AP-MS圖譜的行為則剛好相反(圖4b-d)。值得注意的是,30%的AP-MS相互作用發生在少于100個蛋白質的集中系統中(圖4e),這驗證并提供了相互作用的位置背景。這樣的環境也增加了相互作用檢測的敏感性:集中于之前BioPlex研究中沒有報道過相互作用的蛋白質對,盡管如此,小系統中的蛋白質對比大系統中的蛋白質對有更強的AP-MS評分(P?<?0.0001;圖4f),表明了新的真實的物理交互作用。

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    圖 4. 不同的數據提供不同規模的信息。圖片來源于Nature

    新AP-MS對MUSIC的全局驗證

    在661個MuSIC蛋白中,有370個尚未在AP-MS實驗中作為誘餌進行親和標記。它們出現在被另一種親和標記蛋白質分離出來的獵物蛋白列表中。作為驗證候選系統的直接手段,親和標記了134個前獵物蛋白質并進行了AP-MS,結果識別出了339個物理相互作用。44個MuSIC系統專門針對新的相互作用進行了改進(64%;錯誤發現率(FDR) < 0.1)(圖5a),包括23個假定的候選項。

    Nature | 融合蛋白質圖像和相互作用的細胞結構多尺度圖譜

    圖 5. 使用物理和功能分析的MuSIC探索。圖片來源于Nature

    多尺度的核糖體系統

    通過附加AP-MS數據驗證的候選蛋白中,有7個蛋白組裝,直徑估計為81 nm(95%預測區間[43,151])?;谝呀⒌膬蓚€蛋白(NVL, RPL13A)的pre-rRNA作用、遺傳篩選(KRI1, NOC2L)的支持以及酵母中的pre-rRNA因子(REXO4)的同源性,研究者初步將該系統命名為pre-核糖體RNA處理組裝(PRRPA)。這些蛋白質由于圖像相似、核仁定位和AP-MS網絡鄰域相似而形成一個系統(圖5b, c)。通過針對5種PRRPA蛋白的新的親和純化,恢復了高度特定于該系統的相互作用伙伴(圖5c)。然后,研究者使用RNA免疫沉淀和定量PCR (RIP-qPCR)時,發現這些蛋白質結合了45S pre-rRNA,再次表明pre-rRNA的處理作用(圖5d)。

    研究者還檢測了包含PRRPA的大尺度系統,“核糖體生物起源群落”(347 nm, 95%預測區間[186,646])。該系統包含了與核糖體生物起源無關的額外蛋白質,其中7個被研究者用靶向Dicer-底物siRNAs (DsiRNA)進行了敲除。所有7個都對前-RNA處理有影響,按受影響的特定前-RNA可進行分層(圖5e)。其中三個蛋白在研究者新的AP-MS實驗中被定位(LIN28B, PRR3, ZNF689);每一種都能結合相同群落中的大量蛋白質。

    染色質和拼接

    SRRM1是一個已建立的剪接因子,除了其在RNA剪接復合體3 (71 nm, 95%預測區間[38,133])中的典型位置外,還參與到了其他意想不到的系統中。染色質調節復合物(211 nm, 95%預測區間[113,393]),包括三種組蛋白乙酰轉移酶(HATs) (DMAP1, JAZF1和MORF4L1)和SATB1,它們通過HAT增長來重塑染色質(圖5f)。這些功能表明,該系統中剩余的蛋白質SRRM1和FAM120C也參與調節染色質。

    總結

    本文開發了一種通過神經網絡嵌入每個蛋白質來測量接鄰近性的系統方法。這種分析還與其他類型的信息相集成,并在多個尺度上重塑組件,包括可以進行物理和功能驗證的新系統。在這項工作中,AP-MS的物理交互促進了正確的分配。MuSIC中的系統覆蓋了多個尺度,橋接并超越了免疫熒光和AP-MS的范圍。

    此外,新的蛋白系統可能伴隨著附加的數據模式而出現,如鄰近依賴標記、交聯質譜或低溫電子顯微鏡。探索這些平臺之間的協同作用將是很有趣的工作,所有這些平臺都可能用來校準從而測量分子距離,進而有助于繪制多尺度細胞的圖譜。

    參考文獻

    Qin, Y., Huttlin, E.L., Winsnes, C.F.?et al.?A multi-scale map of cell structure fusing protein images and interactions.?Nature?(2021). https://doi.org/10.1038/s41586-021-04115-9

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放