
在過去的二十年中,靶向共價抑制的研究備受關注,以加強藥物的發現和設計,使得共價對接方法的發展也激增。共價抑制劑的典型特征是配體的親電部分(彈頭)和蛋白受體上的親核殘基(主要是半胱氨酸)之間形成化學鍵。共價抑制劑的反應類型有邁克爾加成、親核加成,親核取代反應,開環反應,二硫化物的形成等。由于半胱氨酸靶向共價抑制劑(包括FDA批準的藥物)的大量存在, Gyo?rgy M. Keseru課題組從Protein Data Bank(1995-2018)中獲得了54個靶標的207個半胱氨酸結合的高分辨(≤2.5?)共價復合物的蛋白數據集,包含了七種反應機制(圖1)。并比較了六種共價對接程序AutoDock4, CovDock, FITTED, GOLD,ICM-Pro和MOE,重現這些共價復合物中配體的晶體模式的準確率,同時探究了影響對接性能的關鍵因素。

?圖1. 對接數據集中配體的親電部分(彈頭)的分布
圖片來源JCIM
六個對接程序的性能測評
共價對接方法首先以預測207個共價配合物中的實驗結合模式(晶體結構中的狀態)進行評估,預測精度用配體重原子的預測結構與晶體結構RMSD值表示,目前文獻中的評判標準是RMSD<2 A。作者選擇了最高得分(Top1)和前十名得分復合物(Top10)的RMSD來分析對接結果(圖2)。以RMSD=2.0?作為成功預測的標準,以Top1的結果可以看到,ICM-Pro以最高的成功率(62% )重現了實驗結合模式;當以top10的結果時,ICM-Pro的成功率可以達到88%。?

圖2. 預測實驗結合模式的成功率。明亮的顏色指最佳評分(Top1)對接構象中的成功率;較淺的顏色指打分top10的成功率
圖片來源JCIM
為了確定對接工具可能存在的評分和采樣誤差,作者對結果進行了更詳細的分析。打分誤差(scoring error)代表最接近晶體配體的構象的打分卻不是最高,抽樣誤差(sampling error)表示top10得分中不能重現晶體構象。表1中展示了六種共價對接程序的結果。ICM-Pro (≈26%)和FITTED(≈25%)的誤差主要來源于打分誤差,其他幾種程序的錯誤率主要來源于采樣誤差,尤其是MOE。

表1.?六種共價對接程序的top1結合模式的誤差分析
表格來源JCIM
圖3展示了打分誤差和采樣誤差的復合物結合模型例子, ICM-Pro對2YJ2復合物的評分誤差是對結合模式中非共價相互作用的不準確評估造成的,預測的Top1對接模式缺少彈頭鄰位酰胺基形成的氫鍵作用,因此與實驗姿態產生了較大的偏差(12.6?)。GOLD對酪氨酸激酶復合物5P9K的采樣誤差是沒有采集到與鉸鏈區形成氫鍵作用的配體構象,這種誤差可以通過配體過濾器進行避免,比如定義抑制劑的結合機制要與鉸鏈區形成氫鍵作用,以確保只有ATP競爭構象。
?

圖3. 打分誤差(左)和采樣誤差(右)的復合物結合模型例子。晶體中配體顯示為紫色,Top1對接構象為橙色,Top10的對接構象為綠色
圖片來源JCIM
影響對接性能的因素
接下來,作者進一步分析了配體和靶標對共價對接工具性能的影響。在配體方面,首先是配體的彈頭類型的影響(圖4)。ICM-Pro和CovDock在Michael additions方面顯示了最佳性能(71%、68%),是目前針對Michael受體庫虛擬篩選的方法。當涉及醛基、酮基和腈基彈頭的親核加成時,除了MOE,其他方法都成功地重現了50%以上的晶體結合模式;并且ICM-Pro和FITTED在醛基上的成功率最高(67%),GOLD在酮類上的成功率更好(58%),而AutoDock4在腈基上的成功率最高(62%),這些發現可以指導不同共價反應機制選擇合適的工具。另外,增加配體的大小和柔性通常會降低預測的成功率。?

圖4.不同的共價結合類型的對接結果分布。表明括號內每種反應類型的復合物數量
圖片來源JCIM
增加目標半胱氨酸的溶劑可及表面積(SASA)有助于改進結合模式預測,一般大于30 ?2便可提高到70%的準確率。另一方面,活性位點的體積也會影響對接的成功率,當口袋體積大于300 ?2時候,六種對接程序的成功率都得到了提高,并且ICM-Pro的成功率與口袋的體積呈現一種線性關系(圖5)。接下來,作者又研究了蛋白質靶點對共價對接工具預測精度的影響,分析同一組蛋白質的Top1結果揭示了對接程序的靶標特異性,有助于找到對感興趣的靶標進行虛擬篩選的合適工具。通過對蛋白質家族的研究,除MOE不超過30%的成功率外,其他對接程序的重現率都可以達到50%左右,其中,ICM-Pro能準確地預測激酶的共價結合模式(90%)。

圖5. 蛋白質描述符對共價對接性能的影響:(a)反應性半胱氨酸的溶劑可及表面積(SASA)對Top1成功率的影響(b)結合位點體積與Top1中的成功率
圖片來源JCIM
總結
本文比較了六種共價對接程序重現207個共價配合物中的實驗結合模式(晶體結構中的狀態)進行評估,對接結果都是使用的默認參數獲得的,預測精度用配體重原子的預測結構與晶體結構RMSD值表示,采用的評判標準是RMSD<2 ???紤]打分top10的配體結合模式,ICM Pro可以達到90%,除了MOE的準確率在50%左右,其他四個對接程序AutoDock4、CovDock、FITTED和GOLD都處于65%-75%。
進一步對結果分析,總結了影響對接程序預測精度的關鍵因素有以下幾點:
??邁克爾加成、親電加成和親核取代反應比開環和二硫化物形成反應更能重現配體的實驗模式;
??增加配體大小和柔韌性通常不利于共價對接;增加非共價藥效團數量可以提高FITTED和ICM-Pro的預測精確度;
??增加目標半胱氨酸的可及性和活性口袋的體積也有助于提高結合模式預測的精確度;
??不同對接程序對蛋白靶點也有特異性,因此建議首選依賴于靶點的對接工具,比如ICM-Pro能以90%的準確率預測激酶的共價結合模式;
??配體在形成共價鍵前后的構象變化也是需要考慮的重要方面,如果對接程序可以在反應后進行構象取樣,可以更好地預測結構修飾比較大的配體。
?
總的來說,筆者個人的想法是目前并沒有100%準確的共價對接程序,所以要針對感興趣的蛋白靶點,用目前準確度相對較高的幾種程序進行綜合評測,選擇最合適的。
?
參考文獻:
?Scarpino, A., Ferenczy, G. G., & Keseru?, G. M. (2018). Comparative evaluation of covalent docking tools.?Journal of chemical information and modeling, 58(7), 1441-1458.
?