<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    引言

    從頭設計治療分子,仍然是一個成本和時間密集的過程,新藥物通常需要超過10年的時間和20-30億美元,才能進入市場,成功率可能低至<1%。因此,迫切需要高效的計算策略,來靶向生成和篩選具有理想治療性能的分子。例如,這里考慮的抗菌肽(AMP)的設計問題。AMPs是應對抗生素耐藥性的候選藥物,而抗生素耐藥性是全球衛生、糧食安全和發展的最大威脅之一。耐藥性疾病,每年在全球奪去70萬人的生命,根據目前的趨勢,預計到2050年,這一數字將上升到每年1000萬人。其中,耐多藥革蘭氏陰性菌,尤其值得關注。AMPs,作為人類目前最后的抗生素,通常包含12-50個氨基酸,由多種高等生物產生,以對抗入侵的微生物。自然AMPs,由于其特殊的結構和功能的多樣性,兼有希望的活性和低傾向誘導(甚至降低)耐藥性,是最有希望的傳統抗生素的替代品和下一代潛在的抗菌劑。

    新型治療性肽設計的合理方法,無論是在實驗室還是在經電腦模擬的中,都嚴重依賴于,結構-活性關系的研究。這類方法,要與大得令人望而卻步的分子空間、復雜的結構-功能關系以及多種競爭約束,進行博弈,如與設計任務相關的活性、毒性、合成成本和穩定性等。人工智能(AI)方法,特別是統計學習和基于優化的方法,在設計小分子和大分子,包括AMPs方面,凸顯出優勢。

    早期的目標生成的深度生成模型,通常將學習限制在,具有所需屬性的固定分子庫中,從而將窮盡性搜索,限制在化學空間的一個定義部分。但這種方法,會影響生成分子的新穎性和有效性,因為固定的庫,僅代表了組合分子空間的一小部分。當前優化方法,包括在學習的潛在空間上的貝葉斯優化(BO),強化學習(RL)或半監督學習(SS)等。然而,這些方法需要代理模型擬合(如BO)、最優策略學習(如RL)或最小化特定屬性的損失目標(如SS),這將受到額外的計算復雜性的影響。因此,有效地控制設計分子的屬性,仍然是一項重要的任務。

    在此,來自美國哥倫比亞大學的Payel Das等研究者,報告了一種有效的計算方法,用于產生具有所需屬性的抗菌素。研究者提出了條件潛在(屬性)空間采樣(CLaSS),利用在感興趣系統的潛在空間上,訓練的屬性分類器的指導,并使用拒絕采樣方案生成具有期望屬性的分子,并使用深度學習分類器以及從高通量分子動力學模擬衍生的物理化學特征,來篩選生成的分子。

    方法概覽

    在此,研究者提供了一種有效的經電腦模擬的篩選方法,該方法使用了,經高通量物理驅動的分子模擬增強的深度學習分類器(圖1)。這種用于從頭抗菌設計的計算方法,明確說明了廣譜效價和低毒性,并且研究者通過實驗,證實了這些特性。

    研究者通過篩選的20個候選序列(從近90000個生成的序列池中)的合成,從而發現了兩個新的短肽(YI12和FK13),它們對不同的病原體有較強的抗菌活性,包括一株難以治療的耐多藥革蘭氏陰性肺炎克雷伯菌。眾多實驗表明,YI12和FK13都是有希望的治療候選者,值得進一步研究。

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    圖1.?方法概覽

    圖片來源于Nat. Biomed. Eng.

    肽的自編碼

    為了對肽潛在空間進行建模,研究者使用了基于由編碼器和解碼器,兩個神經網絡組成的深度自編碼器的生成模型。用?參數化的編碼器q?(z|x)學習,將輸入x映射到一個變分分布,用θ參數化的解碼器pθ(x|z)的目標,是根據所學的分布,給定潛在向量z,重構輸入x,如圖2a所示。變分自編碼器(VAE)是這一類中最流行的模型,它假設潛變量z~p(z),遵循簡單的先驗分布(例如高斯分布)。然后解碼器,在連續表示z的序列上生成一個分布。生成過程指定為,從而對潛在變量進行積分。另一種標準的VAE(被認為是改進的變體)是Wasserstein自動編碼器(WAE)。在VAE/WAE框架內,肽生成被表述為密度建模問題,即估計p(x),其中x是短的可變長度氨基酸串。密度估計程序,必須指定已知肽的高可能性。因此,模型泛化意味著可信的新肽,可以從具有高概率密度的區域在模型下生成。肽序列,是由20個天然氨基酸組成的文本字符串。只考慮長度≤25的序列,進行模型訓練和生成,因為僅需較短的AMPs。?

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    圖2. 屬性控制肽序列生成的階段

    圖片來源于Nat. Biomed. Eng.

    在此,研究者在已知的肽序列上,訓練了一個密度模型。事實上,無監督表示學習,是通過在一個大的文本庫上進行預訓練,最近在文本和語音的下游任務以及蛋白質生物學中,都有令人印象深刻的結果,從而啟發了這種方法。此外,與蛋白質序列生成的類似模型相比,研究者并不局限于學習,單個蛋白質家族或特定三維折疊的密度。相反,研究者訓練了一個,在所有已知的短肽序列表達在不同的有機體上的全局模型。這種全局方法,應該能夠實現跨多個科的有意義的密度建模,它們之間的插值,更好地學習看似合理的肽的“語法”,并超越已知的抗菌模板探索。

    在肽序列上訓練WAE(而不是簡單的VAE)的優勢,從眾多的評價指標中,得到了明顯的體現。此外,還觀察到,當WAE訓練所有的肽序列,而不是只訓練AMP序列時,產生的序列具有很高的重建精度和多樣性。受自然語言過程的啟發,研究者進一步分析了肽WAE的信息含量。使用“探測”的方法,已經證明編碼的句子,可以保留很多語言信息。同樣,研究者分析了序列之間的相似性是否可以通過潛伏z空間的編碼來捕獲,因為已知這些信息可以指定肽序列的生物學功能和折疊度。圖3a顯示WAE模型的序列相似性,與z空間的歐氏距離呈負相關關系(Pearson相關系數=?0.63),這表明WAE本質上,捕獲了肽空間內的序列關系。VAE潛在空間,未能捕捉到這種關系。?

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    圖3.?生成式自編碼器潛在空間的特征

    圖片來源于Nat. Biomed. Eng.

    為了有條件生成新肽序列的最終目標,確保在z空間中學習到的編碼,保留原始序列功能屬性的可識別信息,是至關重要的。為此,研究者分析了空間是否線性可分成不同的屬性,從而使用序列的z編碼訓練用于二元(yes/no)函數屬性預測的線性分類器(圖2b)。

    探索由WAE所模擬的z空間發現,空間確實是線性可分的不同功能屬性。使用WAE z分類器和序列級分類器,對測試數據進行屬性AMP的分類預測準確率分別為87.4%0和88.0%。研究者的序列級LSTM模型,顯示了88%的精確度。與文獻報道的或內部訓練的能夠訪問原始序列的分類器相比,這一比較表明了z級分類器的性能非常接近。研究者的目標是在潛在特征上,訓練一個預測器,從而產生可比較的精度,它可以通過使用CLaSS(條件潛在(屬性)空間采樣),直接從潛在空間進行條件采樣,來自動生成新的AMP候選對象。值得注意的是,比較不同的AMP預測模型并不簡單,因為訓練AMP數據集大小、序列長度、AMP和非AMP的不同定義,以及其他數據管理標準,不同的方法差異很大。此外,與許多現有的預測工具相比,這里使用的z級和序列級AMP分類器,都不需要任何手動定義的特征集。

    對于毒性分類任務,與報告準確率高達90%的相似序列級深度分類器(圖3)相比,使用基于潛在特征訓練的模型的準確率要低得多。這些結果表明,一些屬性,如毒性,從學習的潛在肽表示,對其預測更具挑戰性;一個可能的原因是,在訓練數據中存在較高的類別不平衡。此外,研究者還通過分析,在兩個遙遠的訓練序列之間,沿z空間的線性插值向量生成的序列,來研究潛在空間的平滑性(圖3b,c)。序列相似性、功能屬性(AMP和毒性類概率),以及一些物理化學性質,包括芳香性、電荷和疏水矩(表明螺旋的兩親性),在插值過程中平穩變化。這些結果令人欣喜,因為在更大數量的未標記數據上訓練的WAE潛在空間,似乎在功能、物理化學和序列相似性方面,具有重要的結構。圖3c還表明,在線性插值過程中,可以識別出與兩個端點序列明顯不同的序列(s),這表明經過訓練的潛在空間,具有生成新的、唯一的序列的潛力。

    ?

    CLaSS的控制序列生成

    對于控制生成,研究者的目標是控制一組感興趣的二元(yes/no)屬性,如抗菌功能和/或毒性。為此,研究者建議使用CLaSS。CLaSS利用在肽z空間上直接訓練的屬性分類器,因為它們可以捕獲重要的屬性信息(圖3)。目標,是對指定的目標屬性組合at,有條件地采樣p(x|at)。利用CLaSS(圖2c)對該任務進行了求解,假設屬性條件密度因子為:。研究者近似地從潛在z空間的模型中采樣p(z|at),使用貝葉斯規則,并使用屬性分類器建模p(at|z)(圖2b, c)。由于CLaSS只使用簡單的屬性預測模型和來自z空間模型的拒絕采樣,因此它是一種簡單有效的純正向篩選方法。與現有的可控生成方法(如BO、RL或SS生成模型)相比,它不需要對潛在空間進行復雜的優化。CLaSS易于再使用,同時具有高度的并行性,并且不需要在潛在空間中定義起點。

    由于在潛在特征上訓練的毒性分類器似乎較弱(圖3),抗菌功能(yes/no)被用作控制,從潛在肽空間采樣的唯一條件。生成的抗菌素候選菌,在后代篩選過程中使用序列級分類器篩選毒性。值得注意的是,CLaSS并不對潛在空間執行啟發式搜索,相反,它依賴于基于概率拒絕抽樣的方案,來進行屬性條件生成。CLaSS也不同于基于局部密度的抽樣方法,因為這些方法依賴于,對標記數據進行聚類,然后通過相似度,搜索找到測試樣本的聚類分配;因此,它適合于向前設計任務。與此相反,對于反向設計問題,研究者提出了CLaSS,并通過對潛在空間進行屬性條件采樣,然后進行解碼,實現了有針對性的生成。

    CLaSS生成放大器的特點

    為了檢查CLaSS生成的AMP序列與訓練數據的同源性,研究者進行了BLAST序列相似性搜索。通過使用實際序列的比對評分期望值(E值),來評估序列的同源性,同時使用其他比對指標,如原始比對評分、百分比身份和正匹配、比對中的差距和覆蓋率,來獲得序列相似性的整體感覺。E值,表示查詢與來自特定大小數據庫的序列之間,匹配的統計意義(也稱為生物學意義)。E值越大,表示目標與查詢之間的相似度僅僅是巧合的可能性就越大——也就是說,查詢與目標沒有同源性或相關性。

    此外,研究者分析了匹配得分最高的匹配值。通常,在查詢包含約2.2億個序列的UniProt非冗余數據庫時,使用≤0.001的E值來推斷同源性,這里,研究者采用≤10?6的E值來表示同源性。于是,在考慮與最高比對得分的匹配時,約有14%的生成序列E值≥10,另有36%的生成序列E值為>1,表明生成序列與訓練序列的相似性不顯著。如果只考慮與score >20的比對,則發現E的平均值為>2,進一步說明生成的序列具有非同源性。

    類似的標準,也被用于檢測設計的短抗菌劑的新銳性。CLaSS生成的AMPs也更加多樣化,因為唯一的(即在序列集合中只發現一次)k-mers (k = 3-6),比訓練序列或其片段更豐富。這些結果突出了,當前方法生成短長度AMP序列的能力,平均而言,相對于訓練數據而言,它們是獨特的,而且它們本身也是多樣化的。

    圖4a-d中比較了訓練和生成的AMPs的關鍵分子特征分布,如氨基酸組成、電荷、疏水性(H)和疏水性矩(μH)。CLaSS生成的AMP序列表現出明顯的特征:與訓練抗菌序列相比,這些序列的Arg、Leu、Ser、Gln和Cys含量更豐富,而Ala、Gly、Asp、His、Asn和Trp含量減少(圖4a)。此外,研究者給出了最豐富的k-mers (k = 3,4),分析表明在生成的和訓練的AMPs中,最常見的3-和4-mers是富含Lys和leu的,在生成的序列中頻率更高。

    生成的AMPs的特征是:全局凈正電荷和芳香性介于未標記和AMP-標記的訓練序列之間,而疏水力矩與已知AMPs相當(圖4b-d)。這些趨勢表明,產生的抗菌素仍然是陽離子的,可以形成假定的兩親性α-螺旋,類似于大多數已知的抗菌素。有趣的是,與訓練序列相比,它們也表現出較高的疏水性和脂肪族指數。這些觀察突出了CLaSS生成AMP序列的獨特物理化學性質,這是研究者學習范式的SS本質的結果,這可能有助于它們的治療應用。例如,已知較低的芳香性和較高的脂肪族指數,會誘導短肽具有較好的氧化敏感性和較高的熱穩定性,而較低的疏水性則與較低的毒性有關。

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    圖4. 理化性質比較

    圖片來源于Nat. Biomed. Eng.

    經電腦模擬的后代篩選

    為了篩選大約90,000個CLaSS生成的AMP序列,研究者首先使用了一組獨立的二進制(yes/no)序列水平的深層神經網絡分類器,用于篩選抗菌功能、廣譜有效性、二級結構和毒性(圖1)。通過這次篩選的163個候選分子,隨后經過處理,進行了肽-膜相互作用的粗粒度分子動力學模擬。這些模擬的計算效率,使它們成為選擇高通量和物理啟發肽序列過濾的一個有吸引力的選擇。

    由于沒有使用分子模擬篩選抗菌候選藥物的標準方案,因此,研究者對已知序列進行了一組具有或不具有抗菌活性的控制模擬。從這些對比運行中,發現陽性殘留物和膜脂之間接觸數量的差異,是活性抗菌的預測。具體來說,接觸方差區分高效AMPs和非抗菌序列的敏感性為88%,特異性為63。根本上,這一特征可以解釋為,測量肽序列與模型膜的強大結合趨勢。因此,研究者使用接觸方差截止值2,來進一步過濾,通過分類器篩選的163個產生的AMPs。

    濕實驗室驗證

    最后一組20個CLaSS生成的AMP序列,通過了上述接觸方差篩選,以及它們的模擬和物理化學特性。這些序列在濕實驗室中,進行了抗菌活性測試,使用最低抑菌濃度(MIC;越低越好)對革蘭氏陽性金黃色葡萄球菌和革蘭氏陰性大腸桿菌,進行了測量。同時,11條產生的非AMP序列,也進行了抗菌活性篩選。沒有一個設計的非AMP序列,顯示出足夠低MIC值,從而可認為是抗菌劑,這意味著研究者的方法,不容易出現假陰性預測。研究者還推測,AMP測試集和從已標記和未標記的肽序列上訓練的潛在空間生成的序列之間的域移位,可能導致假陽性預測(18/20)。

    在人工智能設計的20個候選AMP中,兩個序列YLRLIRYMAKMI-CONH2 (YI12, 12個氨基酸)和FPLTWLKWWKWKK-CONH2 (FK13, 13個氨基酸)的MIC值最低(表1)。這兩種多肽都帶正電荷,并具有非零疏水力矩,這表明它們的陽離子和兩親性,與已知的抗菌劑是一致的。研究者利用這些多肽,對更難治療的革蘭氏陰性銅綠假單胞菌和鮑曼不動桿菌,以及耐多藥的革蘭氏陰性肺炎K.肺炎桿菌,進行了進一步的評估。如圖5所示,YI12和FK13均表現出較強的廣譜抗菌活性,MIC值相當。已知,LLKKLLKKLLKK是一種現有的α-螺旋形成AMP,具有良好的抗菌活性和選擇性;因此,研究者進一步比較了YI12和FK13與LLKKLLKKLLKK的MIC值。LLKKLLKKLLKK對金黃色葡萄球菌、大腸桿菌和銅綠假單胞菌的MIC值,分別為>500、>500和63。FK13和FY12對銅綠假單胞菌的MIC值與LLKKLLKKLLKK相當。然而,FK13和YI12對金黃色葡萄球菌和大腸桿菌的MIC值,明顯低于LLKKLLKKLLKK,說明本研究發現的AMPs具有更高的效率。此外,研究者還報告了幾種現有AMP預測方法對YI12和FK13的結果(表1)。iAMPPred和CAMP-RF預測YI12和FK13都是AMPs。另外兩種方法都存在誤分類,如基于局部相似度搜索的DBAASP-SP誤分類FK13。

    與此同時,研究者進一步進行了體外和體內毒性試驗。根據在50%溶血(HC50)時測定的活性和致死劑量(LD50)毒性值(表1),這兩種多肽似乎是生物相容的(因為HC50和LD50值遠高于MIC值);FK13比YI12更具有生物相容性。重要的是,這兩種多肽的LD50值優于多粘菌素B,多粘菌素B是臨床上用于治療耐藥革蘭氏陰性細菌感染的抗菌藥物。

    ?

    表1. YI12和FK13的抗菌活性和毒副作用

    表格來源于Nat. Biomed. Eng.

    Nat. Biomed. Eng. | 傳統分子動力學模擬和新型深度生成模型加速抗菌肽的發現

    圖5.?原子模擬和位阻捕獲研究

    圖片來源于Nat. Biomed. Eng.

    序列相似性分析

    為了研究YI12和FK13在訓練序列方面的相似性,研究者詳細分析了BLAST同源搜索返回的比對分數。評分指標包括,原始比對評分,E值,比對覆蓋率的百分比,身份的百分比,正匹配或相似度的百分比,以及比對間隙的百分比。對訓練數據庫進行e值閾值為10的BLAST搜索,沒有發現任何YI12的匹配,說明YI12不存在有統計學意義的匹配。因此,研究者在更大的UniProt數據庫中,搜索YI12的相關序列,該數據庫由近2.235億個非冗余序列組成,而研究者的模型訓練只包含了其中的一小部分。YI12與其最接近的匹配E值為2.9,是細菌含有EAL-結構域的蛋白的11個殘基片段。

    以上結果表明,即使考慮到UniProt中的所有蛋白質序列,YI12的相似性也很低。研究者還對包含約6550萬專利肽的PATSEQ數據庫進行了YI12的BLAST搜索,仍然獲得了最小E值1.66。在PATSEQ序列中與YI12最接近的序列,是一個由79個氨基酸組成的8個氨基酸片段,相似性為87.5%,覆蓋率僅為66.7%,進一步證實了YI12與已知序列的較低相似性。

    與訓練數據庫中最接近的匹配相比,FK13的特征小于75%,在匹配上存在差距,覆蓋率為85%,這意味著FK13與訓練序列的相似度也很低。然而,YI12比FK13更獨特。在訓練數據庫中與FK13最接近的匹配,是小麥胚乳中嘌呤吲哚堿A蛋白的一個13個氨基酸殺菌域(PuroA: FPVTWRWWKWWKG)的合成變體。FK13的抗菌活性和溶血活性與PuroA接近。然而,FK13與PuroA有本質上的不同;FK13富含Lys,色氨酸含量低,導致較低的整體親水性評分(?0.854 vs ?0.962)、較高的脂肪指數(60.0 vs 22.3)和較低的不穩定性指數(15.45 vs 58.30),這些共同表明了較高的肽穩定性。

    事實上,在濕法實驗中,較低的色氨酸含量有利于FK13的穩定,因為色氨酸在空氣中容易被氧化。較低的色氨酸含量,也涉及到改善體內肽的穩定性。綜上所述,這些結果表明,WAE模型的潛在肽空間CLaSS,能夠通過有效地學習肽中復雜的序列-功能關系,并將這些知識用于控制探索,從而生成獨特和最佳的抗菌序列。當與后續的電腦模擬篩選相結合時,新的和最佳的候選物,具有實驗證實的高廣譜有效性和選擇性,成功率為10%。整個周期(從數據庫管理到濕實驗室確認),在一次迭代中總共花費了48天(圖1)。

    結構和機理分析

    研究者對這兩個序列,進行了全原子顯式水模擬,其中存在一個從α-螺旋結構開始的脂膜。如圖5a所示,這兩個序列觀察到了不同的膜結合機制。YI12使用帶正電荷的n端Arg殘基嵌入膜中,而FK13既嵌入N端Phe,也嵌入C端Trp和Lys殘基。這些結果為研究YI12和FK13,在膜相互作用早期不同的作用模式,提供了機理上的見解。

    用CD光譜對多肽進行了進一步的實驗表征。YI12和FK13在水中均呈隨機卷曲狀結構,而在20% SDS緩沖液中形成α-螺旋。結構分類器預測和全原子模擬與CD結果一致。從CD譜上看,YI12的α-螺旋度似乎比FK13強,這與它更強的疏水矩一致。綜上所示,理化分析和CD光譜分析表明,YI12和FK13的陽離子性質和兩親性螺旋結構,是誘導其抗菌性質的潛在因素。

    為了深入了解YI12和FK13的抗菌作用機制,研究者進行了瓊脂平板實驗,發現YI12和FK13兩種多肽都具有殺菌作用。在2× MIC時,菌落減少了99.9%。

    耐藥性分析

    最后,研究者對亞胺培南(一種靜脈注射的β-內酰胺類抗生素,YI12或FK13),在亞-MIC濃度下的大腸桿菌進行耐藥性-習得研究。從圖5b的結果可以看出,YI12和FK13在傳代25次后均未產生耐藥性,而大腸桿菌在傳代6次后,已開始對抗生素亞胺培南產生耐藥性。同時,研究者還研究了這些多肽對耐多粘菌素b的肺炎克雷伯菌的療效,這是一種耐多粘菌素B-a -內酰胺抗生素的菌株。表1顯示了YI12、FK13和多粘菌素B的MIC值,表明與對耐多藥肺炎克雷伯菌染色(來自ATCC)的MIC相比,這兩種發現的多肽中的任何一種的MIC都沒有增加。相比之下,多粘菌素B對同樣多藥耐藥的肺炎克雷伯菌染色(來自ATCC)的MIC為2 μg ml?1,但當肺炎克雷伯菌對多粘菌素B產生耐藥性時,MIC為>125 μg ml?1。在耐多黏菌素B的菌株中,YI12和FK13的MIC值仍然低于多黏菌素B,說明對YI12和FK13沒有表現出對多黏菌素B的耐藥性。綜上所示,YI12和FK13具有治療耐藥菌株的潛力,因此需進一步研究。

    展望與結論

    在此,研究者提供了一個完全自動化的計算框架,該框架結合了可控生成建模、深度學習和物理驅動學習,用于重新設計廣譜強效和選擇性AMP序列,并通過實驗驗證這些序列的廣譜有效性和毒性。此外,發現的肽對耐最后一種抗生素的菌株,表現出了很高的療效,同時也減輕了耐藥性的發作。濕實驗室的結果證實了,該方法在設計新的和優化的序列時的效率,并且只合成和測試了非常少量的候選化合物。在這個概念驗證研究中,目前的設計方法,獲得了10%的成功率和48天的快速周轉,強調了將人工智能驅動的計算策略與實驗相結合,可以獲得更有效的候選藥物的重要性。這里提出的生成模型方法,不僅可以用于生成新的候選藥物,而且可以用于設計獨特的聯合療法和抗生素佐劑,以進一步推進抗生素治療。

    由于CLaSS是一種通用方法,它適用于各種受控生成任務,可以同時處理多個控件。同時,該方法易于實現、快速、高效和可擴展性,因為它不需要對潛在空間進行任何優化。CLaSS在可重復使用性方面,有額外的優勢,因為添加新的約束,只需簡單的預測器訓練。因此,本研究的未來方向,將探索額外的相關約束條件,如誘導耐藥性、動物感染模型的有效性和細粒度菌株特異性,對使用本文提出的方法設計的AMPs的影響。未來,可將CLaSS的應用擴展到,其他受控分子設計任務中,如靶向性和選擇性藥物樣小分子生成,正在進行中。最后,AI模型,將在一個主動學習框架中,使用模擬和/或實驗的反饋,以迭代的方式進一步優化。

    代碼下載

    https://github.com/IBM/controlled-peptide-generation

    肽序列數據

    https://github.com/IBM/controlled-peptide-generation

    ?

    參考文獻

    Payel Das, Tom Sercu, Kahini Wadhawan, et al., Accelerated antimicrobial discovery via deep generative models and molecular dynamics simulations. Nat. Biomed. Eng. 2021, ASAP. DOI: 10.1038/s41551-021-00689-x.

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放