

NLDock將現有的核酸-配體相互作用評分函數ITScoreNL集成到MDock程序的升級版本中,結合模式預測準確性優于Glide等且計算效率有所提高。
背景介紹
有機小分子作為核酸的非共價調節劑可以阻斷或調節核酸的功能。例如,核酸與小分子之間的相互作用可以調節DNA的轉錄過程,最終抑制蛋白質的生物合成。此外,一些配體作為潛在的抗菌藥物,可以通過提供一個負反饋回路來調節代謝,從而抑制細菌的生長。這些配體往往具有較高的選擇性,應用前景廣闊。因此,識別這些復雜結構對于理解它們在原子水平上的生物過程,從而開發針對這些相互作用的治療干預方案或藥物非常重要??紤]到濕實驗方法的高成本和技術難度,分子對接等計算方法在模擬核酸-配體相互作用和高通量應用中發揮著重要作用。
基于結構的對接,是評估小分子與核酸結合緊密性的一個有力工具。首先在給定核酸結合位點周圍采集每個藥物分子可能的結合模式。然后,使用評分函數對結合模式列表進行排序,并將結合評分作為評價復合物結合親和力的指標。由于核酸通常存在于鹽溶液環境中,會產生強烈的靜電效應。因此,不能直接將蛋白配體相互作用的評分功能用于核酸-配體的相互作用。
一些核酸-配體對接程序,是在傳統的蛋白質-配體對接算法基礎上改編而成的,包括DOCK 6和AutoDock等。雖然蛋白-配體對接在核酸-配體相互作用中取得了一些成功,但由于結合位點的不同,RNA對接參數與蛋白對接參數并不一致。配體結合位點在蛋白質中通常是明確的,但在核酸中,尤其是螺旋結構中,配體結合位點更為廣泛。因此,研究者開發了專門的核酸-配體對接方法,遺憾的是,目前較為流行的算法寥寥,僅有:rDock,MORDOR以及RLDOCK。
主要內容
本文中,來自華中科技大學的黃勝友等人開發了一種快速的核酸-配體對接算法,命名為NLDock,將針對核酸-配體相互作用的內在評分函數ITScoreNL實現集成到MDock程序中。NLDock在四個測試集上進行了廣泛評估,并與AutoDock、DOCK 6、rDock、GOLD和Glide等其他五種最先進的對接算法進行比較。研究表明:NLDock算法在結合模式預測方面,獲得了明顯優于其他對接程序的性能,在77個復合物的最大測試集上,局部剛性、局部柔性和全局柔性配體對接的成功率分別為73%、36%和32%。此外,NLDock方法的計算效率也很高,對于局部柔性配體對接和全局柔性配體對接,平均耗時分別為0.97和2.08 min。相關的研究成果以?“NLDock:a Fast Nucleic Acid-Ligand Docking Algorithm for Modeling RNA/DNA-Ligand Complexes”?為題發布在國際著名期刊Journal of Chemical Information and Modeling上。
NLDock算法工作流
NLDock是一個集成了多個組件的軟件包,包括若干個第三方程序、對接算法、評分功能以及一套額外的工具。圖1給出了NLDock方法的工作流。

圖 1. NLDock算法工作流。圖片來源于JCIM
對接及評分方法
NLDock包含兩個重要的組成部分–位置和得分。首先,對一個配體的所有可能的結合模式進行采樣。然后,使用評分函數來評估與核酸結合的配體的緊密性和特異性。NLDock通過將配體原子與代表結合口袋負像的球點進行窮盡匹配來對結合口袋中的剛性配體進行定位。為了生成和選擇球點,先用dms程序制備核酸結構的分子表面,再利用sphgen_cpp程序在制備的表面上生成球點,最后生成約50,000個形狀互補性最好的結合模式。每個結合模式都通過基于知識的迭代評分函數ITScoreNL進行了優化。最終的對接結果存儲在一個MOL2文件中。用戶可以指定輸出的結合模式的數量。公平起見,所有測試對接任務均采用默認參數。
測試集
為評估NLDock對接協議的性能,研究者使用了以下4個不同的測試集。
1. Yan集:取自SPA-LN研究,包含77個核酸復合物,其中RNA配體復合物62個,DNA配體復合物15個。
2. Ruiz集:取自rDock研究,包含56個RNA配體復合物。
3. Chen集:從Chen等人的文獻中提取,同樣包含56個RNA配體復合物。
4. Philips集:取自Philips等人的ligandRNA研究,包含42個RNA配體復合物。
剛性配體對接
圖2顯示了NLDock剛性配體對接的成功率,它是結合模式預測中topN的函數。為了便于比較,圖中還列出了AutoDock、rDock和DOCK 6的結果。表1詳細對比了考慮前1位和前5位結合姿勢時,四種對接方案的成功率。?

圖 2. 在rmsd≤2.0 ?的標準下,NLDock (A)、AutoDock (B)、rDock (C)和DOCK 6 (D)對剛性配體對接的結合模式預測的成功率。圖片來源于JCIM

表 1. 四種對接方案在不同核酸-配體復合物測試集上局部剛性-配體對接的成功率。表格來源于JCIM
從圖2A中可以看出,NLDock在識別同源-配體結合模式方面的表現明顯優于其他對接程序。如果只考慮得分最高的構象,NLDock從同源配體中找到的rmsd≤2.0 ?的最佳解決方案為73%,AutoDock為34%,rDock為66%,DOCK 6為58%。如果考慮前五名的解決方案,NLDock的成功率為82%,也明顯高于AutoDock、rDock和DOCK 6。這些結果表明NLDock在DNA和RNA-配體對接中的結合構象識別方面具有良好的性能。
對于RNA -配體復合物(圖2B-D),在Yan集中可以觀察到類似的性能趨勢,NLDock也是四個對接項目中表現最好的。在考慮top預測時,NLDock在Ruiz集上的預測成功率為64%,在Chen集上的預測成功率為68%,在Philips集上的預測成功率為71%,AutoDock分別為16%、38%和33%, rDock分別為57%、70%和57%,在DOCK 6上分別為38%、57%和48%。當考慮前5個預測時,NLDock在rmsd≤2.0 ?范圍內正確識別同源配體,Ruiz集為73%,Chen集為77%,Philips集為79%。均高于其他三個對接項目算法。這些結果表明NLDock在剛性對接姿勢確定方面也具有良好的性能。
柔性-配體對接
圖3顯示了NLDock、AutoDock、rDock和DOCK 6在四個測試集上結合模式預測中柔性-配體對接的成功率。從圖3可以看出,NLDock的性能明顯優于其他三個對接方案。表3列出了在考慮前1位和前5位結合姿勢時,4個對接方案的成功率。從表中可以看出,當考慮高分姿勢時,NLDock在四個測試集上的成功率分別為36%、16%、25%和26%。

圖 3. 在rmsd≤2.0 ?準則下, NLDock (A)、AutoDock (B)、rDock (C)和DOCK 6 (D)對局部柔性配體對接的結合模式預測的成功率。圖片來源于JCIM
?

表 3. 四種對接方案在不同核酸-配體復合物測試集上局部柔性-配體對接的成功率。表格來源于JCIM
計算效率
研究者統計了NLDock在四個測試集的139個核酸-配體復合物上進行局部柔性配體對接作業的運行時間,包括配體構象生成和對接計算的時間。NLDock比其他對接方法占用的時間要少得多。如圖4A所示,NLDock在局部柔性-配體對接工作中平均消耗0.97分鐘,而AutoDock為19.06分鐘,rDock為23.93分鐘,DOCK 6為12.18分鐘。對于全局柔性配體-對接,如圖4B所示,NLDock的計算效率也優于rDock。平均而言,NLDock對接一個配體需要2.07分鐘,而rDock需要48.49分鐘。這些結果表明NLDock在局部和全局核酸-配體對接中具有較高的計算效率。

圖 4. 139個核酸-配體對接任務中四種對接程序平均運行時間的對比。圖片來源于JCIM
?
對接模型案例
圖5顯示了NLDock成功預測的兩個核酸-配體復合物的例子。圖5A為一個DNA-配體復合物的對接結果(PDB code:1QV4)。在排名前五的結合模型中,有四個成功預測(rmsd≤2.0 ?),第一個模型rmsd為1.231 ?。圖5C顯示了另一個示例(PDB代碼:1AM0)。在前5個預測結合模型中,第一個預測模型的rmsd為1.03 ?。這些結果表明了NLDock在預測DNA/RNA-配體的正確結合模式方面的準確性。

圖 5. 兩個對接案例的晶體結構(藍色)和NLDock預測(品紅)的對比。圖片來源于JCIM
這樣的識別同源配體構象測試案例對于對接程序評分功能來說極具挑戰性。四種對接算法給出的預測模式中,當考慮top1結合模式時,只有NLDock成功生成了近同源配體構象。圖6E顯示了競爭性結合模式,它具有良好的結合得分,但rmsd最大(綠色)。與晶體結構(藍色)相比,競爭結合構象具有明顯的反向取向。圖7展示了NLDock與商業軟件GOLD及Glide在60個復合物數據集上的預測成功率。
?

圖 6. 一個核酸-配體復合物2KU0的不同軟件對接得分- rmsd關系及復合物的同源配體(藍色)與NLDock預測的rmsd大的一種競爭評分結合模式(綠色)的比較。圖片來源于JCIM
?

圖 7. NLDock、GOLD和Glide分別以配體rmsd≤1.0和≤2.0 ?為標準時,對60個RNA-配體復合物進行預測時,top1預測的成功率。圖片來源于JCIM
結論總結
本文介紹了一種快速的核酸-配體對接算法NLDock,它改進了固有的核酸-配體相互作用評分函數ITScoreNL,其中配體的靈活性是通過對接多個配體構象的集合來實現的??傮w而言,NLDock在結合模式預測和計算效率方面,都明顯優于其他先進的核酸-配體對接程序。
參考文獻
Yuyu Feng, Keqiong Zhang, Qilong Wu, and Sheng-You Huang, NLDock: a Fast Nucleic Acid-Ligand Docking Algorithm for Modeling RNA/DNA-Ligand Complexes, Journal of Chemical Information and Modeling Article ASAP. DOI: 10.1021/acs.jcim.1c00341.