引言
核酸(NA)在各種細胞過程中起著重要作用,是抗癌,抗病毒及抗菌領域中許多疾病的潛在藥物靶標。DNA雙鏈體、DNA G-四鏈體、RNA核糖開關以及mRNA中的延長重復序列這些優秀的靶標引起了人們對作用于核酸的藥物的極大關注,與核酸有關的生物學及其藥物化學研究深入詳實。然而,在計算化學領域,由于在電荷,結合口袋和溶劑化效應等生化和物理性質上與小分子蛋白對接存在差異,導致小分子核酸對接的可用程序不多。因此,為更好地發展核酸對接領域,本文介紹了現有的核酸-配體對接程序及性能,并討論了核酸-配體對接面臨的五大挑戰。

核酸與小分子是怎樣結合的?
小分子與核酸之間的結合可以是共價的或非共價的。如圖1所示,一般認為核酸-配體有三種相互作用模式:1)靜電相互作用,2)溝結合,3)插層和π堆積。
靜電相互作用
設計與核酸穩定結合的小分子時,通常會考慮靜電相互作用。該方法旨在中和帶負電的糖-磷酸骨架,帶正電的離子(Mg2+,Ca2+)以及聚集在骨架周圍的多胺。純凈的靜電相互作用可利用核酸中大量的氫鍵供體和受體來補充氫鍵網絡,從而利用該氫鍵網絡來設計序列特異性的結合劑。

圖1.核酸與配體的三種非共價結合模式:a)靜電相互作用,b)溝結合,c)插層。
圖片來源:EJMC
溝結合
Watson-Crick堿基對的整體幾何結構導致在DNA和RNA螺旋內會形成大溝槽和小溝槽。通常,DNA的大溝比RNA的大溝更淺更寬因此有較多的氫鍵受供體位點,也為更大的分子(蛋白質和肽)提供了更大的口袋。DNA的小溝相對RNA的小溝更淺而窄,常用來小分子藥物在水置換后的結合。DNA小溝結合劑被設計成抗癌藥和抗生素藥物。RNA的小溝與DNA相比有較低的靜電勢,但小分子通常與具有較大靜電勢的RNA大溝結合。單鏈RNA具有強聚陰離子的特性而被金屬正離子和水分子包圍,配體需具有大極性來破壞水合作用殼。RNA自身折疊的特性會形成如發夾和凸起等二級結構進而豐富了RNA的三級結構,最終形成多樣的獨特的結合口袋,能有選擇性地結合小分子。
插層和π堆積
插層是指因在堆積的堿基對之間插入多芳香族分子從而破壞其功能的結合模式。插層劑在臨床上用作靶向DNA的抗癌藥。靶向DNA G-四鏈體的藥物通過π-π堆積于DNA末端或附近結合,小分子在結合過程中對四鏈體的構象變化影響較小。而插層作用首先干擾核酸之間的內部π-π相互作用,會導致DNA大規模運動。
截止2018年6月,PDB數據庫中收集了分子量介于70~1000Da之間的465個RNA-配體復合物和458個DNA復合物。這使基于結構的藥物設計方法用于設計針對特定疾病的靶向核酸配體成為可能。
核酸分子對接的性能評估研究
分子對接可用于虛擬篩選得到潛在候選藥物和提供配體與特定結合位點之間的相互作用信息。通常,如圖2所示,分子對接可以分為兩個部分:a)構象搜索,生成配體的幾種結合模式,b)評分,應用打分函數估算結合自由能并選擇有利的結合模式。

圖2.分子對接的兩個步驟:a)結合模式生成,b)結合模式評分和預測。
圖片來源:EJMC
核酸分子對接程序
與蛋白質分子對接相比,小分子核酸對接方法相對不多。許多蛋白質都包含一個定義明確的疏水性結合位點,而核酸通常有很多具有高電荷密度和極性的暴露于溶劑的結合口袋。這些差異使得需要修改現有的蛋白質-配體對接程序來適應核酸-配體對接。表1中列出了本文中討論的對接程序,本文涉及的打分函數包括DrugScoreRNA、LigandRNA、KScore、iMDLScore1和iMDLScore2。

表1.?本文中討論的對接程序
核酸分子對接用于預測結合模式
將天然配體對接至相應的大分子(自對接)或同一大分子的其他晶體結構(交叉對接)中時,可以基于對接準確預測的結合模式的能力來評估對接程序的性能。對接的配體構象與共結晶結構中配體構象之間重原子的均方根偏差(RMSD)可以量化衡量對接程序預測結合模式和預測結合親和力的準確性。大多數對核酸-配體對接程序的性能比較研究都關注的是預測正確的結合模式而不是結合親和力的成功率,而成功率又因數據集的大小質量不同而有所差異。
2004年,Detering和Varani表明DOCK和AutoDock可以在2.5?范圍內重現實驗結合模式,在16種RNA-配體復合物中成功率為60%。其他研究者在相同的RMSD要求下進行了多項研究。在25種DNA-配體復合物的對接測試中,AutoDock的成功率為68%。AutoDock Vina在未對核酸進行特定處理的情況下,在56種RNA-配體復合物中成功率為29%,而Glide和rDock的成功率分別為18%和54%。在去掉水分子的情況下,60種RNA-配體復合物中,Glide和GOLD的成功率分別為60%和62%。AutoDock在自對接11個氨基糖苷化合物時,平均RMSD為3.25?,作者考慮水分子在配體與RNA結合中的作用及大分子的柔性后,AutoDcok對接的平均RMSD提升為1.41?。MORDOR是專為RNA-配體對接設計的程序,可在2.5?內復現實驗結合模式,在57個案例中成功率為74%。RiboDock用10種RNA-配體復合物進行測試時的成功率為50%(RMSD<2?范圍)。DrugScoreRNA用31種RNA-配體復合物自對接時成功率為42%。另一項研究中,LigandRNA能在42種RNA-配體復合物中找到2?范圍內的配體構象的成功率為36%,而DOCK6的成功率為36%,DrugScoreRNA為31%。當可用共晶結構數增加時,性能研究在更大的數據集上進行。ICM用96種RNA-配體復合物進行自對接的成功率為53%。作者開發的FITED用229種RNA-配體復合物進行自對接的成功率為77%,考慮氫鍵受供體等因素后,成功率提升為83%(RMSD<2.5?)。當配體為插層劑時,AutoDock
在67種DNA-插層劑復合物中再現插層位點和小溝間的結合模式的成功率為80%(RMSD<2?)。
核酸分子對接用于區分化合物活性
在一些研究中評估了對接程序預測結合親和力的能力。ICM在對接一組48種RNA-配體復合物后,復合物的結合能實驗值與計算值之間的線性相關系數為0.71。AutoDock在RNA-氨基糖苷復合物的數據集中的R2為0.84。打分函數KScore在15個RNA-配體復合物和9個DNA-配體復合物上獲得的計算與實驗結合能之間的線性相關系數分別為0.81和0.68。iMDLScore1在45種RNA-配體復合物上的線性相關系數為0.7,iMDLScore1為0.79。結合位點為DNA小溝時,與DOCK相比,AutoDock可以提高活性化合物庫的富集度(富集值(f=1%)=86%)。對接軟件區分活性和非活性結合劑的能力取決于所研究分子的種類。例如,AutoDock對氨基糖苷的表現較好,而DOCK對芳香族分子的準確性更高。
上述討論可以提供對于不同對接程序及打分函數的見解,但有一定的局限性。首先,成功率很大程度上取決于數據集大小、復合物的選擇及RMSD范圍。其次,自對接的研究結果在指導發現新化合物的過程中可靠性有限。最后,少有研究報道預測的結合親和力如何與實驗值相關。因此,這些方法的一般適用性和預測能力仍然難以捉摸,需要更廣泛的評估研究。
在真實世界中對對接程序的準確性驗證是通過考察虛擬篩選能否發現新穎的結合劑來完成的。2010年,使用ICM對靶向于G-四鏈體的20000種化合物進行基于對接的虛擬篩選。最終選擇了5種化合物經實驗驗證fonsecin B是G-四鏈體穩定劑。2011年,使用DOCK 3.5.54對靶向于腺嘌呤核糖開關(AR)的超過2500種化合物進行基于對接的虛擬篩選,考慮了配體與AR之間的大量氫鍵和π堆積,通過實驗驗證選擇了5種得分最高的化合物,其中有4種在微摩爾范圍內表現出與AR的親和力,且共結晶得到的結合模式與對接預測的接近。
核酸分子對接面臨的五大挑戰
從蛋白到核酸的程序定義
多年來,被廣泛運用的分子對接程序定義了藥物化學家設計和優化與蛋白質結合的方式,其開發重點是蛋白質。研究核酸的藥物化學家在進行對接研究時,首先考慮的是基于現有的蛋白小分子對接程序性能來對自己的體系進行修飾。有些對接程序在蛋白小分子復合物訓練集上的準確性足夠高所以不需要進行修飾,例如AutoDock。DOCK6則推出了將小分子對接進核酸的特殊功能,改進了構象采樣方法,可以提高對接更大且更柔性的配體時的準確性(G-四鏈體結合劑和氨基糖苷類化合物較大且有更大柔性)。相應地,優化后的方法在蛋白質-配體復合物上的準確性會降低。DOCK中還添加了一個考慮金屬離子和水的項目。有些程序則專門針對核酸-配體對接,如MORDOR、RiboDock(演變為rDock)。無論哪種方法都需要在開發對接程序時考慮核酸與蛋白的不同之處。
打分函數
與蛋白相比,核酸的極性大且某些非常規相互作用需要特殊處理,所以需要專門設計打分函數以預測RNA與配體的親和力。RiboDock采用基于經驗的打分函數,添加了一個解釋帶正電的碳(如胍鹽)與帶負電的基團(如羰基)之間相互作用的術語,以對不常見的靜電相互作用建模。還引入了一個有利于π-π堆積的術語。DrugScoreRNA采用基于知識的打分函數能更頻繁地觀察到相互作用,LigandRNA也是基于知識的打分但觀測重點在氫鍵的方向性。打分函數的主要開發挑戰在于在高通量方式下計算核酸-配體結合時的熵能消耗。目前使用AutoDock生成的結合模式簇的大小來估計任何給定結合模式的振動熵。
RNA和DNA的柔性
大多數方法忽略核酸的固有柔性將其視為剛性受體,但RNA可能適用與配體結合時會運動而產生構象變化(圖3)。通過這些運動,配體被封裝在結合口袋內,幾乎不暴露于溶劑中。

圖3.嘌呤核糖開關在結合配體時的局部構象運動。
圖片來源:EJMC
目前沒有一項普遍適用的考慮核酸柔性的技術。為處理RNA的柔性,MORDOR使用分子力學最小化技術將RNA分子限制在實驗得到的結構上從而誘導與配體的結合。然后,將配體放置于某個熱點堿基上后便可以探索受體的表面。對接過程中的能量最小化步驟非常耗時,所以該方法不適用于大型分子庫。但該方法在2.5?范圍內能達到超過70%的準確率。使用DOCK將化合物定位到靶標位置再用ICM的內部坐標探索構象空間也能處理核酸的柔性。另一種選擇是通過一組預定義的RNA構象進行整體對接,這是通過組合一組AutoDock柵格來實現的,該柵格可對柵格中不同的RNA構象進行建模,從而對構象集合建模。還可使用NMR和分子動力學模擬結合的方法構建RNA整體動態構象,再將小分子對接到整體上來解決RNA構象柔性的問題。除此之外,DrugScoreRNA采用彈性勢能網絡來精準描述RNA-配體相互作用,該方法僅限于局部較小的構象變化。還有一種新穎的蒙特卡洛(MC)算法,從頭將藥物對接至DNA,完全考慮了兩個分子的柔性,復合物的柔性由MC變量定義且無需事先選擇結合位點。
金屬離子和水分子
核酸的高電荷性質導致其會與水分子和金屬離子產生強烈的相互作用。對于核酸-配體復合物,橋連水分子在穩定絡合物方面起關鍵作用,能提供額外的氫鍵相互作用。金屬離子結合位點起初是通過分子動力學模擬來識別的。后來研究Glide對接25種水合RNA-配體復合物時發現有水分子時的準確性顯著提高,但自對接和交叉對接時需要的水分子可能不同。于是,開發了一種通過“可置換”的分子來模擬關鍵水分子的新穎方法。
通常,在核酸的結合位點發現諸如Mg2+和Mn2+之類的金屬離子,將其作為RNA靶標一部分來考慮時,會改善預測的結合模式的準確性。但是,在大多數可硬的核酸對接方法中,尚未解決橋接水分子和金屬離子的問題。
高電荷大分子
現實中,所有磷酸鹽的負電荷都被溶液中的抗衡離子中和,但這些離子由于其位置不固定而很難在分子對接中被考慮進去。另一個關鍵點是當氫結合到諸如磷酸酯的各種集團上時對水分子極化的調節,而對接程序往往將所有水視為等效的。
總結
蛋白-配體對接方法雖然可以應用于核酸-配體對接,但結合模式預測準確度較低(很少高于60%)。低成功率的一個原因是沒有考慮核酸的柔性,它是核酸與配體結合的關鍵結構因素。水分子和金屬離子在結合過程中也很重要,開發新的對接程序或修飾蛋白-配體對接方法時必須考慮這些因素。盡管現有的這兩類對接程序都顯示出潛在的優越性能,但仍有改進的空間。除此之外也需要越來越多的共晶結構數據來支持更廣泛的核酸對接程序評估。
參考文獻:
Nicolas, M. et al. Challenges and current status of computational methods for docking?small molecules to nucleic acids, European Journal of Medicinal Chemistry (2020), https://doi.org/10.1016/j.ejmech.2019.02.046