<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    Nature | AlphaFold:生物史最全蛋白質圖譜的繪制者

    Nature | AlphaFold:生物史最全蛋白質圖譜的繪制者
    Nature | AlphaFold:生物史最全蛋白質圖譜的繪制者

    Nature | AlphaFold:生物史最全蛋白質圖譜的繪制者

    引言

    在這個生化環材領域人才瘋狂內卷的時代,人工智能的加速發展,再一次改變著人類的生活軌跡及研究進程,至此,內卷的路越走越遠,越來越卷……

    這不,繼2021年07月15日,《Nature》發布了DeepMind有關AlphaFold的最新版本——AlphaFold2之后,僅僅一周,2021年07月22日,AlphaFold2便再次登上《Nature》。并且,這兩期的《Nature》甚至來不及編輯,都是以手稿的形式直接發布,可見內容之震撼,這一點通過同期《Nature》報道的一些專業人士對明星AlphaFold的看法中也可以看出:

    (1) 倫敦大學學院(UCL)的計算生物學家Christine Orengo堅信,“從我的角度來看,這是完全的變革。有了這些蛋白質的形狀,你就能深入了解它們的機制”。

    (2) 曾在AlphaFold的早期迭代中為DeepMind提供過建議的,同樣來自倫敦大學學院的計算生物學家David Jones贊嘆道,“這是令人驚訝的第一步,我們有這么龐大的數據!”

    (3) 還有許多科學家認為AlphaFold的一些預測與非常好的實驗模型相當,因此其影響將是劃時代的。

    (4) DeepMind聯合創始人兼首席執行官Demis Hassabis表示,“這是人工智能系統迄今為止對推進科學知識做出的最大貢獻。我認為這么說毫不夸張?!?/p>

    接下來,讓我們一起來看看,明星AlphaFold為何如此受人追捧?

    明星AlphaFold究竟干了什么?

    人類基因組包含超過20000種蛋白質,而截至目前,只有其中三分之一通過實驗確定了它們的三維結構,而且在許多情況下,這些結構也只是部分已知的。在此,谷歌子公司DeepMind,通過應用最先進的機器學習方法AlphaFold,大規模地擴展了幾乎整個人類蛋白質組(人類蛋白質的98.5%)的結構覆蓋范圍。結果數據集覆蓋了58%的殘差,具有置信預測,其中一個子集(所有殘差的36%)具有非常高的置信度。此外,該工具還預測了從老鼠、玉米到瘧疾寄生蟲等各種其他生物的幾乎完整的蛋白質組。

    目前在公共數據庫中,可以找到的35萬多種蛋白質結構,其準確性各不相同。但研究人員同時表示,到今年年底,這種資源將增加到1.3億個結構,將給生命科學帶來革命性的變化。

    圖1. 人類介導子復合體,一直是結構生物學家最難理解的多蛋白系統之一。圖片來源于Nature

    明星AlphaFold可以帶來什么?

    上周,DeepMind發布了最新版本AlphaFold2的源代碼,以及詳細描述了它是如何開發的(學術團隊已經開始利用這些資源進行有用的預測)。DeepMind在準備公開代碼的過程中,為了提高代碼的運行效率,對代碼進行了改進。通常CASP目標的一些預測需要幾天時間,但AlphaFold2現在可以在幾分鐘到幾小時內就計算出它們。因此,由于這種額外的效率,DeepMind團隊預測人類基因組編碼的幾乎所有已知蛋白質的結構,以及20種生物物種的蛋白結構。

    DeepMind的科學工程師Kathryn Tunyasuvunakool表示,“我們希望給實驗人員和生物學家一個明確的方向,告訴他們應該依賴哪些預測?!?Tunyasuvunakool還補充說, “對于人類蛋白質組來說,AlphaFold2對單個氨基酸位置有58%的準確預測已經是足夠好的了,足以確定蛋白質折疊的形狀。這些預測中的一部分,盡管只占總數的36%,而這已足夠精確,能夠詳細描述對藥物設計有用的原子特征,比如酶的活性位點等?!?/span>

    與此同時,研究人員也強調,數據轉儲只是一個開始,而不是結束。他們想要驗證這些預測,更重要的是,將它們應用到迄今為止不可能的實驗中。

    圖2. AlphaFold已經預測了人類和超過20種生物物種中幾乎所有的蛋白質結構。圖片來源于Nature

    明星AlphaFold可能影響什么?

    研究者預計,常規的大規模和高精度的結構預測,將成為一個重要的工具,允許人類從結構的角度解決新的問題。目前,研究者正通過公共數據庫(由歐洲生物信息學研究所托管,網址:https://alphafold.ebi.ac.uk/,已正式上線),向社區免費提供他們的預測。正如前文所述,AlphaFold2上周儲存了大約36.5萬個結構,預測到年底將擴增至1.3億個,接近所有已知蛋白質的一半。

    然而,我們應該清醒地認識到,面對如此龐大的數據,結構生物學家應該思考,如何處理這么多結構?如何將它們和實驗結合起來?正如David Jones在接受采訪最后談到,“這將會有很多會議?,F在我們有了1.3億個模型,這會如何改變我們對生物學的看法呢?或許這并不能改變當前現狀。但我猜測未來它會的?!?/p>

    換句話說,機器已經做好準備了,那么,人類呢?是否已經做好人工智能和大數據帶來沖擊的準備了嗎?

    參考文獻

    1. Jumper, J.?et al.,?Highly accurate protein structure prediction with AlphaFold?Nature, Nature, 2021, Published: 15 July 2021. DOI: 10.1038/s41586-021-03819-2.

    2. Tunyasuvunakool, K.?et al., Highly accurate protein structure prediction for the human proteome, Nature, 2021, Published: 22 July 2021. DOI: 10.1038/s41586-021-03828-1.

    3. Nature News: DeepMind’s AI predicts structures for a vast trove of proteins, Nature, 2021, Published: 22 July 2021. DOI: 10.1038/d41586-021-02025-4.

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放