<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    利用蛋白質語言模型指導抗體設計

    蛋白質語言模型是一類應用自然語言處理(NLP)技術來分析和理解蛋白質序列的模型。這些模型借鑒了語言模型在文本處理中的成功經驗,通過將蛋白質序列視作由氨基酸組成的“句子”,來預測和生成新的序列、識別功能域、理解蛋白質結構和功能等。這種技術不僅可以幫助研究人員識別哪些突變可能是有效的,還可以預測這些突變是否會提高蛋白質的功能。進而指導蛋白質活性以及可開發性等多種性質的改造。

    利用蛋白質語言模型指導抗體設計

    例如,斯坦福大學Peter S. Kim團隊在2023年在《自然生物技術》上發表的一項研究,展示了如何利用通用蛋白質語言模型有效地進行抗體親和力的改造。具體步驟如下:

    1. 模型訓練?研究團隊使用了ESM-1b和ESM-1v兩個語言模型,這些模型分別在UniRef50和UniRef90數據庫上進行訓練。這些數據庫包含了數百萬個自然界中觀察到的蛋白質序列,涵蓋了廣泛的蛋白質變異。
    2. 突變選擇?通過語言模型計算所有單個氨基酸替換的進化可能性。選擇那些進化可能性高于野生型的替換,并通過實驗篩選這些替換是否能夠改進抗體的結合親和力。
    3. 實驗篩選?對每種抗體進行兩輪篩選。在第一輪中,篩選單個氨基酸替換的變體。在第二輪中,篩選組合了多個有利替換的變體。通過生物層干涉技術(BLI)測量這些變體的抗原結合強度。
    4. 親和力測定?針對臨床相關的抗體,測量它們的單價抗原結合片段(Fab)的解離常數(Kd);對于未成熟的抗體,測量雙價免疫球蛋白G(IgG)的表觀解離常數,并進一步測量最高親和力變體的Fab片段的Kd值。
    利用蛋白質語言模型指導抗體設計

    研究結果

    研究團隊通過上述方法,對七種人類免疫球蛋白G(IgG)抗體進行了優化,取得了顯著成果:
    1. 抗體親和力提升
    • MEDI8852:這種廣泛中和的抗體結合甲型流感血凝素(HA),通過實驗篩選,最佳變體的親和力提高了七倍。
    • mAb114:這種埃博拉病毒抗體的最佳變體在結合埃博拉病毒糖蛋白(GP)時,親和力提高了3.4倍。
    • REGN10987:對新冠病毒Beta變種刺突蛋白(Spike)的親和力提高了1.3倍,對Omicron BA.1受體結合域(RBD)的親和力提高了5.1倍。
    • S309:這種新冠病毒抗體的變體在不同病毒株上的親和力均有提升,相較于目前的治療性抗體sotrovimab,其最佳變體在與新冠病毒Wuhan-Hu-1 S-6P結合時,親和力提高了1.3倍。
    2. 未成熟抗體優化
    • MEDI8852 UCA:這種抗體的最佳變體在與HA H1 Solomon結合時,親和力提高了2.6倍,并且對某些HA亞型的結合親和力也有顯著提升。
    • mAb114 UCA:這種抗體在與埃博拉病毒GP結合時,最佳變體的親和力提高了160倍。
    • C143:這種抗體的最佳變體在與新冠病毒Wuhan-Hu-1 Spike結合時,親和力提高了高達23倍。
    3. 高效性
    在所有抗體中,每種抗體只需要篩選20個或更少的變體,并且在兩輪實驗中就達到了顯著的親和力提升。

    結論

    本研究證明了利用蛋白質語言模型可以有效指導人類抗體的進化和優化,顯著提高其結合親和力。在本研究驗證的7個抗體中,第一輪設計有14-71%的突變體提高了親和力,第二輪設計絕大部分突變體都提高了親和力。這種方法不僅在抗體優化中顯示出巨大潛力,還可以推廣到其他蛋白質家族的進化研究中,如抗生素抗性和酶活性等。
    如何才能更好的運用蛋白質語言模型進行抗體設計呢?

    ?

    WeMol中集成了多種蛋白質語言模型?

    利用蛋白質語言模型指導抗體設計

    WeMol中蛋白質語言模型的應用

    1. 通過序列生成,填充,氨基酸概率預測指導人源化,親和力和穩定性改造
    利用蛋白質語言模型指導抗體設計
    如上圖,在WeMol中,利用蛋白質語言模型對整個序列的氨基酸概率進行分析,可以發現序列中出現的不常見的氨基酸。針對這些氨基酸進行突變可以幫助進行蛋白的人源化設計,親和力改造,以及穩定性改造等多種應用。
    在下圖針對抗體CDR區域的PTM位點改造的案例中,通過蛋白質語言模型預測該位點氨基酸的頻率,(下圖1)通過點擊Generate Mutants按鈕可以自動生成推薦的突變并顯示到WeSeq的編輯器中(下圖2)。
    利用蛋白質語言模型指導抗體設計
    利用蛋白質語言模型指導抗體設計

    2.?合成抗體文庫設計
    在WeMol中可以利用蛋白質自然語言模型設計的文庫,針對CDR區域進行突變模擬,生成類內源抗體的大量抗體序列,在極大豐富文庫的多樣性的同時,優化可開發性和人源性等各方面的性質,使得篩選到的hit分子具備一步到位的成藥潛力。
    利用蛋白質語言模型指導抗體設計
    如果對蛋白質語言模型的其他應用或者方法開發有興趣可以聯系我們。

    參考文獻:

    arXiv:2402.17156.

    Bioinform Adv. 2022 Jun 17;2(1):vbac046.

    Nat Biotechnol. 2024 Feb;42(2):275-283.
    關于唯信wecomput

    Wecomput(唯信計算)致力于”計算技術驅動創新藥研發”,基于對創新藥物研發流程的深刻理解,融合人工智能、生物物理、高性能計算等技術,打造了獨具特色的自動化、智能化、數字化的藥物分子生成、設計與模擬平臺,有望革新傳統藥物發現方式,驅動小分子、蛋白質、抗體、mRNA等創新藥物的研發進程。核心團隊成員來自國際知名AI制藥公司、頭部藥企、知名互聯網公司、985高校,在制藥、生命科學、人工智能、軟件開發等交叉領域有豐富的經驗、深刻的理解和飽滿的熱情。

    母公司北京中大唯信科技有限公司于2015年注冊成立,入選國家高新技術企業,2021年獲紅杉資本股權投資,并入選NVIDIA Inception計劃資深會員。至今,Wecomput已服務海內外數百家客戶,涵蓋眾多生物醫藥企業、高校、醫院、科研機構,并傾力打造了自主知識產權的分子數字化智能計算平臺WeMol。欲了解更多信息,請訪問官網www.tjthrhy.com,或關注公眾號“唯信wecomput”。
    關于WeMol

    WeMol(wemol.wecomput.com)是Wecomput開發的面向生物制藥、材料、化學等領域的新一代分子數字化智能計算平臺,集成了計算生物學、人工智能、量子化學等領域的上百種Wecomput自研及開源的計算與可視化模塊,核心算法的速度、準確度超過或媲美國外主流商業軟件,尤其特色的抗體人源化設計、蛋白質免疫原性預測、虛擬親和力成熟、高通量虛擬篩選、RNA序列設計等算法已在多家知名藥企的數十個藥物發現項目中得到驗證和廣泛應用。WeMol基于先進的流式架構,可將復雜計算流程簡單化、自動化,并支持低代碼定制開發和靈活擴展,是業界首款同時面向計算科學家及非計算專業的濕實驗人員,旨在構建一個簡單、易用、智能、可擴展、可追溯、可重現的一站式計算平臺,全方位覆蓋大分子生物藥設計、小分子化合物設計、分子模擬、數據分析等應用場景,可對Hit->Lead->PCC各階段進行全鏈條賦能。發布至今,WeMol已獲得了國內外數百家藥企及學術單位的青睞與好評。

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放