
引言
抗生素耐藥性,是人類社會中最嚴重的醫療問題之一,目前每年在歐洲造成超過2.5萬人死亡,在美國造成3.5萬人死亡。幾十年來,具有抗菌素耐藥性的微生物數量一直在增加。這些微生物引起的感染缺乏有效的治療方案。在過去幾十年里,人們發現抗生素缺乏,嚴重影響了經濟和人類的福祉。因此,當前重要的是,人類必須開發出能夠對抗耐多藥微生物,并減緩抗生素耐藥性的進化和傳播的抗菌素。
抗菌肽(AMPs),基本上是地球上所有生物自然產生的,通過多種作用機制作為防御系統,來抵御入侵的病原體。作為免疫系統的一部分,這些分子已經進化了數十億年,并提供了廣譜保護,以抵抗各種病原微生物,包括細菌、真菌、病毒和寄生蟲等。然而,由于一些障礙,如毒性、有限的生物利用度、對病原體的特異性不足以及難以大規模生產等,阻礙了AMPs作為治療傳染病的治療藥物的發展。然而,最近,在設計策略、合成方法和輸送系統方面的進展,正在擴大將合成AMPs轉化為治療耐藥感染的下一代標準護理抗生素的可能性。在這里,研究者的綜述提供了最新的計算和合成生物學工具的發展,以推進抗菌藥物的應用,以幫助補充人類目前的抗生素庫。
AMPs:用于工程的多功能支架
AMPs具有許多固有的醫學特性:它們可以殺死細菌,靶向耐藥微生物生物膜,促進傷口愈合,并調節免疫反應。這些分子的多功能特性(圖1A),使它們成為藥物開發的極好模板,包括有希望成為臨床可用抗生素的替代品。例如,陽離子AMPs,如多粘菌素B和gramicidin S,已經在臨床和外用非處方藥中使用了很長時間,陽離子lantibiotic nisin通常被用作抗菌食品添加劑。然而,到目前為止,只有D2A21、SGX942、p2TA、omiganan等少數AMPs,在三期臨床試驗中證明了其有效性(表1),凸顯了傳統AMPs的局限性,這一點仍有待解決。在這里,研究者描述了這些不同分子的前景和挑戰,并描述了通過合成生物學和計算生物學技術的發現、設計和生產,來最大化其潛力的途徑。

圖1.?AMPs的多功能和多樣性的性質和序列空間探索的機會
圖片來源于ACS Nano

表1.?最先進的AMPs在臨床試驗的范例
表格來源于ACS Nano
?
真正具有生物活性的肽分子的發現,可能有助于改變將AMPs轉化為臨床的成功率;然而,這仍然是一個突出的挑戰。廣闊的肽序列空間(圖1B),提供了許多未被探索的可能性,并可能產生創新的肽序列,從而構成治療。由于人類對不同肽序列的生物學、物理和化學性質知之甚少,因此很難預測肽所具有的眾多生物活性。在過去的幾十年里,一些計算資源被開發來促進AMP的設計,包括數據庫、預測工具和設計模型。
分子描述符
計算方法和啟發式代換,是預測AMP結構和功能的常用方法。例如,定量構效關系研究(QSAR),已被用于描述氨基酸殘基及其特征。在這種情況下,物理化學描述符和結構描述符,可能相互關聯或依賴,在QSAR建模和最終研究的生物活性中具有權重。Supady等人識別了結構描述符,如低能量構象,利用遺傳算法,識別了表現出低能量剖面的多肽構象空間片段。作者預測了在全局最小值之上的一個能量窗口內的所有構象,而不是尋找全局最小能量。這一策略,防止了對特定力場參數化的潛在偏差結果,從而使搜索適用于更廣泛的參數選擇,并使對構象空間的探索更廣泛。
計算機輔助設計
到目前為止,幾乎所有的肽工程都涉及到,對自然產生的分子的修飾。然而,通過在自然序列中提出突變,計算機指導的肽設計允許探索更大的序列空間區域,這是以前沒有在實驗室或整個進化中分析過的。計算機指導設計的另一個優點是,它不需要對生成的每一個變體進行綜合和篩選,從而節省了時間、勞動力和費用(圖2A)。目前,計算機指導的預測AMP功能的方法的主要局限性之一是:需要標準化和可靠的生物數據作為有效的設計過程的輸入。計算方法已經發展到可以訓練計算機開發和增強分析,以優化傳統的非計算設計方法,如不同類型的SAR策略。這些技術可以,與各種基于自然序列的結構相結合。肽可以精確地生成,也可以通過進化模板來生成生物活性肽來改進。
預測技術
當分子的潛在活性譜未知時,基于配體的模型對于AMP的預測是有效的。通過數據挖掘,Mardirossian等人從寬吻海豚身上識別出了Tur1A和Tur1B,這是兩種富含脯氨酸的AMPs。作者發現,Tur1A通過內膜轉運體SbmA和YjiL/MdM被大腸桿菌內化,而不造成膜損傷,并通過與核糖體結合,阻斷起始期到延伸期的過渡,抑制細菌蛋白合成。另一方面,Tur1B適度地抑制蛋白質合成,似乎通過一種不同的,目前尚未清楚的作用機制,來發揮其抗菌活性。越來越多的大型數據庫,使得機器學習(ML)/人工智能(AI)算法能夠用于AMP預測。例如,Yoshida等人提出了一項概念證明研究,描述了通過序列空間探索發現AMP的有效策略。作者使用一個閉環的方法結合遺傳算法,ML,和體外評價,以提高抗菌活性的多肽。這些努力從一個小的天然陽離子模板Temporin-Ali (FFPIVGKLLSGLL-NH2)中發現了44個先導肽。僅經過三次迭代,獲得的擊中數比原始型天然AMP活性高160倍?;谥С窒蛄繖C(SVM)的分類器,也可以通過其作用機制有效地預測AMPs。Lee等人開發了一種分類器,用于研究由不穩定膜作用的螺旋AMPs。該方法認為螺旋結構是分析類似肽,最重要的活性描述符。作者觀察到AMPs增加了細胞膜負高斯曲率,這是磷脂膜裂變過程的特征。

圖2.?抗菌肽的開發工具
圖片來源于ACS Nano
從頭設計
AMPs的從頭設計,導致產生與數據庫中AMPs幾乎沒有相似之處的完全序列。從頭技術,如從分類器和改進的算法所做的預測推斷,已經產生了生物活性序列。該技術是藥物活性肽的重要來源,如Bhardwaj等人提出的超穩定受限肽。作者設計了高度穩定的18-47殘基,二硫化物交聯肽,其中一部分是雜手性和/或N-C骨干環化的。
Hosseinzadeh等人,采用了從頭設計混合手性肽大環的方法。作者通過幾乎完全的主干取樣、序列設計和能量繪景計算,列舉了由L-和D-氨基酸組成的大環肽所采用的穩定結構。這種技術可以識別超過200個預計折疊成單一穩定結構的肽,當分析時,發現它們與計算模型預測的肽相似。
遺傳算法
用于闡明結構-功能關系的計算方法,正在成為研究多肽與微生物膜相互作用的有用工具。最近的努力“訓練”計算機執行達爾文的進化算法,并通過突變、選擇和重組輸入的肽序列,機器能夠進化這些分子,構建具有體內抗感染活性的人工肽抗生素(圖2B)。這些工具很有前途,但可以進一步優化。例如,遺傳算法(GA)可以生成最優解,其中包含已有數據庫中描述的大約一半的自然AMPs,從而為探索完全人工序列留下改進空間。Porto等人采用了一種令人興奮的計算機輔助設計策略,來優化肽Pg-AMP120,其結果是將植物序列作為AMP模板,用于隨后的計算機輔助合成序列設計。通過算法的中斷來探索之前未探索的組合序列空間,從而使其達到穩定解。計算機制造的guavanin 2是一種很有前途的AMP,它在水中是無結構的,并且在疏水環境中經歷了螺旋到螺旋的轉變。最重要的是,guavanin 2在一個具有臨床前相關性的小鼠感染模型中,顯示了有希望的抗感染活性。
模式識別算法
算法也可以用于具有確定結構的肽的預測(圖2C)。模式識別算法通常用于圖像和語音識別,用于識別在較大蛋白質或前體結構中加密的氨基酸模式,以及分析大AMPs的內部結構,使識別特定的結構特征和抗菌活性的分子決定因素成為可能。先前對抗菌活性的序列要求的了解,使人類能夠在大型數據庫中搜索這些模式。例如,Pane等人利用模式識別技術,發現了人胃蛋白酶A中隱藏的AMPs。這些多肽對人類細胞具有低毒性,并在小鼠模型中表現出抗感染活性。序列比對是比較生物序列的常用方法,也是在包含數千種蛋白質的大型數據庫中,搜索相似序列的最簡單方法。有兩種主要的方法來搜索AMP模式:隱馬爾科夫模型(profile-HMM)和正則表達式(REGEX)。校準結果然后提交給特定的計算機程序,如HMMER或Pratt。REGEX的一個重要特征是,有助于功能的氨基酸理化性質可以通過經驗的方式整合到平臺中。例如,Silverstein等人表明,來自不同肽家族的一些序列可以很好地對抗配置-HMMs,正如觀察到的硫蛋白和snakins/GASA肽。
除了用于AMP的鑒定外,REGEX還可以用于探索不同的生物功能和設計非常規的AMPs。一旦確定了這些肽的主序列,就可以設計具有相似氨基酸組成的序列,并保持相似的物理化學特征平均值,如平均疏水性或凈電荷。該方法用于分析混雜肽,即在不同環境或條件下具有多種生物學功能的多肽。這種模式匹配的通用性,得到了Loose等人的證實,他們開發了一種不同的合理地AMP設計方法,從多個數據庫中提取了大約700個AMPs的序列,產生了一系列具有類似抗菌應用特性的不同AMPs。
近年來,數據庫中可用的信息越來越多,使得算法的設計,除了執行序列比對和氨基酸含量比較,能夠提供結構信息和結構分類之間的其他一些結構工具。因此,由于大量的描述符依賴于結構信息,通過對肽和蛋白質的氨基酸序列進行非常精確的分析,可以實現對模式的準確預測。Pane等人報道AMPs的抗菌活性與產物Cm×Hn×L呈線性相關,其中C為凈電荷,H為整個序列平均疏水性的一致平均值,L為AMP的長度。作者報告了一種有效的計算策略,來識別在較大蛋白質或前體結構中加密的AMPs。
Cardoso等人利用Joker算法從E. coli MerP片段中提取了AMP EcDBS1R5,這是一種18個氨基酸的肽,此前該算法預測它是一種抗菌劑。E. coli MerP片段展示了一個螺旋含量高而不是標準的可預測的物理化學特性,典型賦予小型螺旋陽離子抗菌活性肽,如低凈正電荷和長度(+ 2)或高疏水性(~80%的氨基酸序列的疏水殘基)。這種修飾是通過插入一個富含賴氨酸的基序來實現的,該基序導致EcDBS1R5的疏水性(約58%)和更高的疏水矩,這些特性有助于EcDBS1R5在體內具有高的抗菌和抗感染活性,以及高的抗菌膜活性。
?
基于統計學肽設計
基于統計的計算方法代表了傳統計算機引導的肽設計的替代策略。這些方法使用生物信息學工具,如統計建模、SAR研究、神經網絡和ML,來分析和增強數據庫中描述的AMPs的活性。Porto等人最近發表了AMP數據庫和數據挖掘的廣泛概述。計算方法結合結構和物理化學特征的使用可以導致抗菌分子的準確預測。
分子動力學
分子模型(MM)和分子動力學(MD),是分析AMPs在生物膜或模擬它們的人工膜上的結構與活性關系的有效方法(圖2D)。MD可以用來推測AMPs的作用機制,也可以用來提取影響抗菌活性的生物描述符(圖3A)。然而,時間尺度和通過經驗分析驗證的需要,仍然是這項技術的限制因素。最重要的生物過程,包括AMP的內化或在膜失穩之前與膜的相互作用,都是幾毫秒長的。然而,目前的MD模擬運行在納米到微秒的量級上。因此,對于復雜生物過程的精確建模,仍然存在幾個數量級的差距。目前,只有少數幾個小組能夠在小范圍內,進行驗證MD模擬預測的實驗。研究者預計MD模擬將能夠預測AMP的結構,并提供這些制劑在與微生物接觸時的完整原子細節軌跡,從而使計算機輔助機制闡明研究成為可能。例如,Melo等人通過結合量子力學和分子力學,開發了一套完整而全面的套件,用于對復雜過程進行精確的計算機輔助分析。作者將分子動力學和可視化軟件(NAMD和VMD)與量子化學包ORCA和MOPAC合并,創建了動態過程的界面,如肽與膜和膜組件的相互作用。

圖3.?用于肽設計的高通量框架
圖片來源于ACS Nano
自主學習計算方法
神經網絡,特別是深度學習,作為一種計算機引導的方法,正在加速AMP的發展(圖3B)。與其他方法相比,該方法具有直接預測AMP活性和通過自學習構建序列潛力的顯著優勢。例如,遺傳算法的目標是基于輸入序列進化序列,輸入序列作為初始數據集,其結果不用于改進算法。
監督ML方法,用于發展抗菌活性預測模型。其采用了兩種不同的預測策略:序列大小變化和序列順序。一旦選擇了序列順序,大小就不能修改,根據每個位置的氨基酸殘基頻率進行預測。否則,如果序列大小變化是一個選項,序列將被轉換為描述符。
AMP的異質性代表了肽設計領域的另一個挑戰,預測方法,如遺傳算法、ML和深度學習,已被用于補充其他序列搜索方法。另一個可以用來更好地理解和設計AMPs的重要工具是MM,通常與MD相關聯。建??梢酝ㄟ^兩種技術來識別相似的序列:線程和從頭算建模。線程方法使用模板從查詢序列中預測三維結構,而從頭建模,也被稱為從頭建?;蜃杂山?,利用設計的能量函數和廣義的構象概率來指導構象搜索,預測一個沒有先前結構信息的蛋白質結構。這些方法已成功地應用于半胱氨酸保守肽的篩選,包括防御素、環肽和蛇肽,以及抗利什曼肽的鑒定。與MM肽相關的另一個挑戰,是將具有不同生物活性的相似結構與功能進行關聯。
另外,深度學習技術也可以用來生成AMPs。Müller等人提出了,一種可通過組合設計生成從頭生成多肽的循環神經網絡,例如,使用不同氨基酸殘基進行單突變篩選。該模型捕獲了α-螺旋AMP序列的模式,從而從學習的環境中生成肽。該方法的結果是,82%的活性AMPs預測,而65%的隨機采樣序列與訓練集相同的氨基酸分布。
最近FDA批準了磷酸二胺嗎啡啉寡核苷酸,可用于治療杜氏肌營養不良癥。Wolfe等人使用ML預測了細胞穿透多肽,作為這些寡核苷酸的有效傳遞手段。成了64個寡核苷酸-肽綴合物,并將活性數據用于擬合隨機決策森林分類器,以預測給定肽的共價結合是否會增強化合物的活性。所有計算預測的陽性序列,在檢測中都是活躍的。
混合預測計算機引導方法,可作為AMP預測策略的替代方法。Schneider等人將混合網絡和深度學習模型結合起來,創建了一種體系結構,可將多種多樣的多維描述符組合在一個自組織圖中。將描述符轉換為二維圖像進行進一步處理;然后,二維圖像被用作前饋神經網絡的輸入層。與缺乏自組織映射的前饋網絡分類器相比,所提出的混合模型提高了分類精度和具有更高的預測魯棒性。
采用計算方法設計AMP的一個缺點是預測—驗證步驟與下一輪的優化和AMPs預測無關。因此,需要更多的方法,來更全面地評價肽-膜的相互作用。如上所述,MD模擬是一種強大的方法,在AMPs和生物膜之間的相互作用的原子水平上提供動態信息(相對于靜態)。盡管這種方法成本高、耗時長,但已被用于闡明AMPs的簡單作用模式,并已被應用于設計通過形成小孔和/或破壞細胞膜發揮作用的肽。
展望與結論
至此,研究者描述了最近的一些進展,這些進展可能使AMP分子按需編程成為可能。經驗和計算方法和工具的標準化,在生物學中仍處于起步階段。結合計算機科學、建模和合成生物學的原理,將允許更系統地探索多肽的作用和活性模式,從而產生新的抗生素。
參考文獻
Marcelo D. T. Torres, Jicong Cao, Octavio L. Franco, Timothy K. Lu, and Cesar de la Fuente-Nunez. ACS Nano 2021, 15, 2, 2143-2164. DOI: 10.1021/acsnano.0c09509.