蛋白質結合口袋(protein binding pockets,以下簡稱口袋)是指蛋白質表面或內部具有適合與配體結合的空腔,口袋周圍的氨基酸殘基決定了它的形狀,位置,物化特性以及功能[1]??诖膭恿W對蛋白質的特異性相互作用至關重要。蛋白質結構的柔性(flexibility)與運動(mobility)允許結合口袋的打開、關閉和適應,從而調節配體的結合過程和發揮特定的蛋白質功能。這意味著在預測結合性能以及設計新配體時必須考慮蛋白質的內部運動。
(一)?口袋動力學的分類
蛋白質結構的柔性對口袋的影響可分為五種不同類型(圖1)
(1)子口袋(subpocket)的出現/消失
(2)鄰近口袋(adjacent pocket)的出現/消失
(3)呼吸運動(breathing motion),指初始口袋的擴大或收縮,大致保留初始口袋的形狀
(4)通道/隧道(channel/tunnel的打開/關閉,可將蛋白質內的口袋與溶劑連接,包括蓋子(lid)的運動
(5)變構口袋(allosteric pocket)在某個位置出現或消失

圖1:五種不同的口袋動力學示意圖
?
以下使用具體例子說明這五種類型。
(1)子口袋
熱休克蛋白(HSP90)N端的ATP結合區,沒有配體時,口袋橙色部分中間為loop,結合配體后(藍色)形成α-helix,下面疏水部位即子口袋。PDB ID: 1yer,1uyd。(圖2)

圖2.?子口袋的形成
橙色和藍色為導致變化的部位,灰色為蛋白質內部,紅色為口袋的變化,下同。
?
(2)?鄰近口袋
白介素(IL-2)具有高度適應性的蛋白結合位點,可被小分子阻斷,在蛋白結合位點附近的表面有一個柔性疏水子口袋,當結合小分子抑制劑時,側鏈旋轉,骨架微調(紅色),形成鄰近口袋,為結合小分子抑制劑提供了額外的空間。PDB ID: 1pw6,1m4a。(圖3)

圖3.?鄰近口袋的形成
?
(3)?呼吸運動
抗凋亡蛋白(BCL-XL)口袋周圍的α-helices在結合不同配體是會發生較大的變動,當較小的配體結合時,口袋較小(橙色),當較大的配體結合時,口袋有較大的舒張(藍色)。PDB ID: 3zln,3qkd。

圖4.?呼吸運動
(4)?通道/隧道
核磁共振(NMR)結構顯示非特異性脂質轉運蛋白(ns-LTP )結合配體前列腺素B2 (prostaglandin B2)時的通道的打開(藍色)與關閉(橙色),PDB ID: 1cz2模型2與8。

圖5.?通道的打開
??
(5)?變構口袋
P38有絲分裂原活化蛋白激酶(P38 MAPK)中保守的Asp-Phe-Gly motif運動形成變構口袋。Phe側鏈向ATP/ADP結合位點翻轉,打開變構口袋,減少了結合位點的體積,因此,在變構位點的抑制劑結合可抑制ADP/ATP結合。PDB ID: 1kv1,1ny3。

圖6.?變構口袋的形成
?
以上五種分類在具體的口袋變化中是可能重疊的。比如說,形成子口袋前可能先發生呼吸運動;當變構口袋鄰近初始口袋時也可認為是鄰近口袋。鄰近口袋的位置特點使得二價配體能同時結合兩個口袋。
?
(二)口袋的識別
通過實驗方法得到帶配體的蛋白質結構,其配體的位置可用來定義結合口袋。另外也可用計算機方法進行識別。
實驗方法
這里主要介紹幾種常見的蛋白質結構解析方法。
(1) X射線晶體學(X-ray crystallography)
X射線擊中晶體產生散射束,由探測設備記錄其衍射數據,進而計算電子密度圖,這些電子密度圖能夠用來計算蛋白質結構信息,最終得到蛋白質構象。該方法可得到高分辨率的蛋白質靜態三維結構,另外還可得到原子振動信息,如B-factor。但在解決大分子蛋白質上具有局限性,并且通常依賴于同源蛋白質的結構信息。截至目前PDB中89.30%蛋白質結構用該方法測定。
(2)?核磁共振波譜學(nuclear magnetic resonance,NMR)?
不同原子具有不同的核磁共振吸收波譜能力,根據原子波譜性質將通過核磁共振實驗收集的原始數據計算轉化成蛋白質結構和動力學信息。該方法在溶液中和非晶態的蛋白質進行測量,能夠獲得高分辨率蛋白質靜態三維結構信息,而且能夠獲得某些構象轉換的動力學信息。但是大尺寸蛋白質的磁化信號難以測量。截至目前PDB中有8.22%%蛋白質結構用該方法測定。
(3)?三維電子顯微鏡(3D Electron Microscopy,3DEM)
近年來興起的,同時也是最常用的3DEM技術為冷凍電子顯微技術(cryo-EM),優點在于能夠獲得蛋白質自然條件下的結構信息,更接近于蛋白質在生物系統中的真實結構并且能夠獲得超大規模蛋白質或蛋白質復合體的結構信息,如病毒等。截至目前PDB中2.14%蛋白質結構使用3DEM方法測定。
?
計算方法
計算機方法識別蛋白質口袋主要基于幾何特征與生化物理特征的結構分析。幾何特征一般包括三維網格(grid)、空間球體(sphere)、α-share理論,和數學形態學理論。生化物理特征一般包括結合能和蛋白質的序列保守性等物理化學屬性和生物學屬性。
(1)?基于網格的預測算法(e.g. POCKET,LIGSITE,LIGSITEcs,Q-SiteFinder)
POCKET是最早的基于網格的一種預測算法,前后改進發展出LIGSITE與LIGSITEcs。這種算法的理論依據是小分子傾向于結合在蛋白質表面大而深的口袋型區域。POCKET、LIGSITE和LIGSITEcs分別掃描網格中的蛋白-溶劑型-蛋白和表面-溶劑型-表面事件,滿足條件的節點則表示具有一定的埋藏度(buriedness)。POCKET使用3個方向,后兩者使用7個方向,POCKET、LIGSITE使用的是原子坐標,而LIGSITEcs使用的是康諾利表面(connolly surface)。(康諾利表面是表示蛋白質分子光滑的曲面的模型,由蛋白質分子表面部分與探針分子相切原子的范德華表面連接在一起形成的)。Q-SiteFinder類似于LIGSITE,但pocket位點的排序是探針與蛋白原子之間的范德華相互作用能之和。
(2)?基于球體的預測算法(e.g. SURFNET, PASS)
SURFNET是在兩個原子之間放置了一個球體,球體與這兩個原子的范德華表面相切。如果這個球體與其他原子的范德華表面有交集,那么縮小球體的半徑,使它不能包含任何原子。體積最大的球體定義了最大的口袋。
PASS與SURFNET的算法不同,是一種只在蛋白質表面初始化球體的方法。它先將探針球包裹在蛋白質表面,去除無法滿足埋藏數(burial number)的球體,埋藏數是球體周圍8?之內的蛋白質原子的數目。然后重復操作,直到沒有新的探針球被保留,活性位點(ASPs)根據埋藏數的大小以及周圍的球體個數確定。
(3)?基于α-share理論的預測算法(e.g. CAST)
CAST采用三維理論將蛋白質的三維結構描述成為由許多的三角形的構成的網。蛋白質中的原子構成了三角形的頂點。然后通過將小的三角形合并到鄰近的大的三角形進行聚類,結合位點就是最后得到的空的三角形的集合,即內部不包含其他原子。

圖7.?不同口袋識別方法示意圖[2]
?
宏算法Metapocket 1.0綜合了LIGSITEcs, PASS,Q-SiteFinder, 和 SURFNET四種傳統預測算法進行口袋預測[3],2.0版本又添加了另外四種傳統預測算法Fpocket、GHECOM、ConCavity、POCASA,其在預測成功率上最多可以比傳統算法提高12%,Metapocket2.0與其他預測口袋算法可參見文獻[4]。
?
(三)?蛋白質口袋構象采樣
實驗可能無法獲得所有可能影響化合物選擇性的構象。計算方法可以填補這些空白。對上述五類口袋動力學,MD模擬都適用,其精準度高但計算量大,并且在模擬時長內可能無法對口袋動力學進行充分的采樣,因此,其他一些計算效率更高但精度較低的方法也被用于研究大規模蛋白質運動引起的蛋白質結合口袋動力學。以下對兩種基于約束幾何模擬的方法進行介紹。
tCONCOORD[5]
tCONCOORD是對CONCOORD[6] (fromCONstraints to COORDinates)的擴展,CONCOORD先對實驗獲得的蛋白質結構所有成對的原子間距離進行測量。距離約束限制設定在±Dnm。相互作用緊密的,D值較小,相互作用弱的,D值較大。不同類型的相互作用對應不同的距離限制D,之后通過隨機產生滿足約束條件的結構。tCONCOORD將估算氫鍵穩定性納入約束定義中。實驗上結構顯示,蛋白質發生構象轉變時通常涉及一個或多個氫鍵的打開。保持氫鍵“干燥(dry)”環境是構象穩定性的先決條件,蛋白質的折疊與周圍疏水基團對氫鍵的系統“脫溶(desolvation)”效果有關。因此,分析一個特定氫鍵的鄰域可以為水分子攻擊它的概率提供線索,而水分子攻擊它的概率與構象打開概率直接相關。tCONCOORD通過估計溶劑化概率來預測不穩定氫鍵。通過計算MD模擬后的多種蛋白質的每種原子的徑向分布函數(RDF,Ri),加權后生成的值Pi,作為溶劑化參數來估計特定原子的特定距離內找到水分子的概率。

得到的溶劑化參數用于評價特定氫鍵的周圍環境。周圍環境是以氫和受體原子為中心,半徑6 ?(排除三個鍵長外的原子)的區域,然后計算溶劑化分數。

溶劑化分數越大表示該區域越不穩定,超過一定閾值的區域則在后續結構生成時不加約束條件,閾值的設置參考見圖8,具體的閾值根據研究體系與研究目的而改變。結構的生成是從隨機坐標開始構造結構,迭代地對原子的位置進行修正,直到滿足所有的約束條件。因為每次運行都是從隨機坐標開始的,所以每個新生成的結構都完全獨立于前一個結構。故無法得到從一個構象到另一個構象的路徑的信息,也沒有關于兩個構象態之間的勢能信息。

圖8. tCONCOORD閾值的設置
A. 290個蛋白質結構氫鍵溶劑化分數的分布;B. 以人類朊蛋白為例(PDB: 1QM0),氫鍵的分布情況,骨架之間的氫鍵(藍色),骨架與側鏈之間的氫鍵(橙色),側鏈之間的氫鍵(綠色);C. 閾值設置為2.2時檢測到的不穩定的氫鍵(黑圈中紅色部分);D. 閾值設置為2.1檢測到的不穩定的氫鍵,數量比C中更多。
?
?FRODA[7]:The framework rigidity optimized dynamic algorithm
若將蛋白視為網絡結構,那么共價鍵鍵長,鍵角,共價雙鍵,氫鍵與疏水作用都是受約束的, 蛋白質形狀的改變則發生在可旋轉的二面角。FRODA首先使用FIRST中的pebble game algorithm對蛋白進行剛性分析判定決定剛性部位與可旋轉的二面角。若將蛋白比做‘body-bar’,每個原子最開始都有六個自由度,每中限制類型帶來一定數量的“bar”,也就減少對應的自由度“pebble”,其中疏水作用2“bar”,單共價鍵或氫鍵5“bar”,Locked的共價鍵(double, peptide/aromatic)6“bar”。?“bar”?多的區域為“stressed”, “bar”?等于“pebble”的區域為isostatic,“pebble”多的區域為flexible。接著用虛構的剛性體(ghost templates)替代原子間相互作用(圖9),ghost模板的位置和方向通過最小二乘法確定。然后通過對所有原子進行隨機位移,在約束下過通過迭代過程探索構象變化的相空間。迭代可分為3步驟,將ghost模板匹配到原子位置,原子匹配到ghost模板,分子在空間上回到正確的新構象(圖10)。

圖9. ghost模板示例
一個具有兩個可旋轉二面角的聚合物鏈(上)與三個重疊的ghost模板(下)相關聯。每一組互相為剛性的原子屬于共同的ghost模板,而與一個可旋轉鍵相關聯的原子則屬于多個ghost模板。

圖10. ghost模板約束條件下的迭代過程
由幾何模擬確定的乙烷分子的運動。
(a)初始原子位置
(b) ghost模板
(c)隨機原子位移
(d)將ghost模板擬合到原子上
(e)將原子擬合到ghost模板
(f)和(g)重復(d)和(e)的迭代
(h)直到找到新的構象
?
研究口袋動力學的方法還有很多,不同方法具有不同的適應范圍。例如MDPocket,PocketAnalyzer,EPOSBP,TRAPP等適用于探索鄰近口袋、子口袋和呼吸運動的形成,SPACER和MCPath適用于變構口袋的檢測與分析,Caver 3.0可用于描述MD軌道中的隧道(tunnel)。另外,不同的口袋動力學對配體結合過程具有在熱力學和動力學上具有不同的影響。
參考文獻
1.??? Stank A, Kokh DB, Fuller JC,Wade RC. Protein Binding Pocket Dynamics. Acc Chem Res. 2016;49(5):809-15.
2.??? Huang B, Schroeder M.LIGSITEcsc: predicting ligand binding sites using the Connolly surface anddegree of conservation. BMC Struct Biol. 2006;6:19.
3.??? Huang BD. MetaPocket: A MetaApproach to Improve Protein Ligand Binding Site Prediction. Omics-a Journal ofIntegrative Biology. 2009;13(4):325-30.
4.????張增明.?蛋白質—小分子結合位點預測新算法研究開發?[碩士]:?浙江大學; 2012.
5.??? Seeliger D, Haas J, de GrootBL. Geometry-based sampling of conformational transitions in proteins.Structure. 2007;15(11):1482-92.
6.??? de Groot BL, van Aalten DM,Scheek RM, Amadei A, Vriend G, Berendsen HJ. Prediction of proteinconformational freedom from distance constraints. Proteins. 1997;29(2):240-51.
7.??? Wells S, Menor S, Hespenheide B, Thorpe MF. Constrained geometricsimulation of diffusive motion in proteins. Phys Biol. 2005;2(4):S127-36.
轉載自QMCLab:蛋白結合口袋動力學的分類與識別方法
