

背景介紹
基于片段的藥物發現(FBDD)已經成為一個用來識別探針分子和先導化合物的強大工具。過去20年里,FBDD發現了4種已批準的藥物,數十種FBDD衍生化合物目前正在臨床試驗中。
片段熱點映射不同于其他方法,它提供了對片段利用結合位點內特定相互作用的傾向的定量估計。此外,圖的可視化使用戶對結合口袋有了直觀理解。這兩個特性的結合使得這種方法對于以理性和數據驅動的方式發現命中片段的方法來說特別有吸引力,同時也支持專家的洞察力和直覺。
哈佛大學Mihaela D. Smilova團隊開發了一種“集成”熱點圖方法(圖1)。通過比較兩個集成映射,可以得到一個熱點選擇性映射。這從蛋白結構維度解釋了決定化合物對同一蛋白結構域家族成員的選擇性差異。結果圖可以通過Hotspots API自動生成的腳本在PyMOL中可視化,或者在任何支持.ccp4或.grd格式的分子查看軟件中進行可視化。這種方法已經在Exscientia公司的許多藥物發現項目中被采用。作者以溴域蛋白BRD1和BRPF1,CAMK家族激酶p38α和ERK2,以及更遠緣的激酶PIM1和CK2α為例對該方法做了介紹。
項目代碼公開地址
https://github.com/prcurran/hotspots
https://github.com/ccdc-opensource/hotspots/tree/master
https://github.com/CMD-Oxford/hotspotEnsembles

圖1. 生成集成和選擇性映射的工作流程。圖片來源:JCIM
溴域:BRD1和BRPF1之間的選擇性
溴域蛋白屬于一種表觀遺傳調控因子家族,在過去的十年中,研究者對選擇性溴域抑制劑的開發產生了重要的興趣。首先,作者使用23個BRD1和26個片段結合的BRPF1結構計算了集成圖。圖2顯示,這些圖譜能夠識別選擇性結合特征,自動捕獲這些信息,而不需要肉眼檢查大量的蛋白質結構。BRD1和BRPF1的受體選擇性圖證實了這種差異,由受體傾向的區域(紅色)顯示。在這個例子中,從一個集合中生成選擇性圖是至關重要的,因為選擇性特征并不存在于來自BRD1結構的所有單個圖中。這是由于氫鍵對供體和受體基團的取向敏感,其中主鏈中的扭曲運動可能意味著在少數構象中沒有檢測到這種特征。

圖2. 人類溴域的選擇性:BRD1優于BRPF1。圖片來源:JCIM
設計密切相關的激酶:p38α和ERK2之間的選擇性
在人類蛋白激酶家族中,一個被稱為“守門人”的ATP結合口袋殘基是選擇性的一個重要決定因素。這是被p38α選擇性抑制劑SB1所利用的,如圖3,它對相關的MAPK激酶,尤其是ERK2具有選擇性。5個片段結合的p38α結構對17個ERK2的片段結合結構的非極性選擇性圖可以識別和突出抑制劑結合的選擇性疏水口袋,如圖3所示。

圖3. 激酶選擇性:識別gatekeeper的差異。圖片來源:JCIM
SB1的氟苯基占據了p38α的選擇性疏水后袋,并與ERK2的谷氨酰胺gatekeeper發生沖突。熱點映射能夠僅使用片段結合結構作為集成映射的輸入來識別這個特征。在針對p38α進行片段篩選的情況下,選擇性圖可以用來指示哪些片段(以及片段中的化學基團)可能對p38α而不是ERK2具有選擇性,這為在化合物設計過程的早期階段實現選擇性提供了建議。
盡管只使用了5種結構,但p38α集合中的所有配體都有獨特的Murcko支架,而且它們都探索了選擇性口袋。最小藥效團氯苯酚與典型激酶鉸鏈熱點相比,它優先探索gatekeeper后面的選擇性區域。ERK2集成包含更多的結構和更高的配體多樣性(19個結構和11個獨特的框架),而結構如PDB ID:3ERK(不包括在集成因為它在300Da限制下)可以達到口袋ERK2,大多數ERK2片段則不能。盡管p38α集合中的結構數量相對較少,而且p38α和ERK2集合之間的結構數量明顯不平衡,但該方法仍然能夠幫助識別選擇性特征。
CK2α和PIM1:與同一配體結合的遠緣激酶
在最后一個案例研究中,作者探索了一個來自不同亞家族的激酶之間選擇性的回顧性例子:人類CK2α(CK2亞家族)和人類PIM1(CAMK亞家族)。
CX-4945最初是作為一種ATP競爭的口服CK2α抑制劑來開發的,對其靶標具有nM親和力,但對PIM1激酶顯示出脫靶活性。CK2α抑制劑CX-5279則保留了對CK2α的親和力,同時對PIM1具有選擇性。
CK2α對PIM1的非極性選擇性圖顯示了CK2α中的一個非極性傾向區域。由于 PIM1 結構中殘基 F49 的構象,該區域在 PIM1 中是不可接近的(圖4)。選擇性圖表明,在苯基位置的苯環上放置一個更大的、高親脂性的取代基可能會提高CK2α對PIM1的選擇性,這與文獻報道的一致。
CK2α和PIM1之間的另一個區別在于鉸鏈區域,并且可以通過選擇性圖來識別。供體選擇性圖突出顯示了這個特性(圖4)。但文獻中表示這部分對選擇性沒有明顯影響。然而,所得到的配體親脂性較低,并形成額外的氫鍵,這在設計過程中是可取的;選擇性圖證明了這種修飾。在非極性選擇特征的情況下,對整體結構的目視檢查顯示,F49始終采用與選擇性配體相沖突的向內構象,增加了對該特征的選擇性的信心。?

圖4. 調節CK2α抑制劑對PIM1的選擇性。圖片來源:JCIM
探索和調整方法參數
集成映射的質量高度依賴于輸入集成數據的質量和數量。集成的一個關鍵屬性是所包含的結構的數量。而晶體學片段篩選實驗可以提供多達數十個配體與目標蛋白復合物結構,這樣的數據并不總是可用的。通過降低集成圖的頻率閾值,單個結構對集成圖的貢獻也可以在更大的集成中被放大。對此,作者給出了不同的閾值范圍設定的建議。?

圖5. 設置集成圖的頻率閾值參數。圖片來源:JCIM
在組裝蛋白質集合時需要考慮的另一個關鍵點是相互排斥的蛋白質構象狀態的存在。在上面討論的激酶例子中,只包括了DFG-in構象中的結構。在蛋白質可以采用互斥狀態的情況下,作者發現,為每個狀態編譯單獨的集合可以為根據特定構象設計化合物提供更詳細的信息。
原則上,理想的選擇特征既得分很高,又與其他具有脫靶結合傾向的特征保持合理的距離。作者在文中給出了在不同情況下進行計算分析設定的不同截止值范圍。
選擇性圖譜識別了同一蛋白家族中
不同目標子集之間的選擇性決定區域
在確定選擇性圖能夠識別同一家族中蛋白質對之間的已知的選擇性特征后,作者開發了一種程序,允許跨目標蛋白家族進行自動和客觀的分析。
作者再次選擇關注人類溴域,圖6中,作者選擇BRD1作為目標蛋白,并與高序列同源性和低序列同源性脫靶進行比較。選擇性圖被組合成“總結”選擇性圖,使用為編譯集成圖而開發的方法。頻率截止點被設置為零??偨Y選擇性映射包含關于可以利用該特性的特定脫靶目標的信息。兩個顯著特征如圖6所示。

圖6. 選擇性圖識別了同一蛋白家族中目標子集的選擇性決定區域。圖片來源:JCIM
接著作者在文獻中鑒定了已發表的抗BRD1活性的化合物,以及至少一種脫靶以及已發表的具有至少一種脫靶的復合物的晶體結構。確定了8種化合物,它們可用于結合BRD1和至少一種脫靶物,它們也已與其中一種感興趣的蛋白質在復合物中結晶。
使用Hotspots API對這8種化合物的結構進行了重新編碼,以確定與預測的選擇性區域相互作用的取代基。如果在復合結構中至少有一個重原子獲得了一個特定的特征(圖6 C中的最后兩列),則定義一個命中。
選擇性圖證明能夠檢測到這些特征,而且由于對復合構象的評分計算速度非??欤總€構象幾秒鐘),這類分析可以用來客觀地對大批量對接的潛在后續構象進行評分。之前發布的Hotspots API還允許從圖中提取藥效學特征,然后可以作為CrossMiner等程序的輸入,用于化合物的生長和合并。
結論
調節化合物的選擇性時,蛋白質家族中的結合位點比較是一個關鍵信息。結合位點的差異可以用來賦予特定靶點的選擇性,而共享區域可以提供很多藥理學的見解。隨著結構化數據數量的增長,需要自動化的方法來處理、總結并向用戶呈現這些數據。本文中,作者證明了片段熱點映射能夠識別在過去的藥物發現中用于引入選擇性的選擇性決定域。集成圖和選擇性圖是一種快速和可擴展的方法,可以直觀地呈現密切相關的蛋白的結構信息,并產生實現選擇性的假設。
參考文獻
Smilova MD, Curran PR, Radoux CJ, von Delft F, Cole JC, Bradley AR, Marsden BD. Fragment Hotspot Mapping to Identify Selectivity-Determining Regions between Related Proteins. J Chem Inf Model. 2022 Jan 24;62(2):284-294. doi: 10.1021/acs.jcim.1c00823. Epub 2022 Jan 12. PMID: 35020376; PMCID: PMC8790751.