
引言
大規模的構象變化對于關聯蛋白質的結構和功能都至關重要,雖然分子模擬能在原子層面觀察構象的轉變,但許多構象是短暫形成的,分布具有隨機性,確定相關結構和它們相互轉換的機制仍然是巨大的挑戰。
本文中,研究人員以一種參與免疫反應并與HIV感染相關的蛋白CypA為例,介紹了結合加速MD(aMD)模擬和Markov模型(MSM)探索構象空間的方法。通過構建MSM模型確定了五個主要的優勢構象狀態以及狀態相互轉換的通路,并且通過理性設計,尋找到2個全新的突變位點,其中D66A會改變蛋白構象,而突變H70A可以穩定構象。aMD/MSM方法對于設計用于蛋白質工程和藥物開發中蛋白質自由能分布的研究具有廣闊的前景。
靜態晶體結構的局限性

圖1:綜合多尺度的結構生物學
圖片來源:Frontiers in Molecular Biosciences
分子動力學構象采樣
??分子動力學(MD)模擬在過去40年中經歷了巨大的發展,可以稱之為”計算顯微鏡“。隨著分子力場的發展,高性能計算機的發展,MD模擬已經成為了研究和描述生物大分子結構變化以及動力學行為的重要工具。如果對局部結構的探究,MD模擬時長往往在幾百納秒的尺度就足夠。但是對于全空間或者某些感興趣構象的采集,則需要更長的模擬時間,一般是為毫秒的時間尺度。而且由于過渡態的隨機性,時間尺度和本身較高的能壘,使得對過渡態的采樣難上加難。
??目前流行的是兩種類增強采樣方法,要么通過增加模擬覆蓋有效時間,能夠詳盡地采樣,比如元動力學(metadynamics),傘形采樣(umbrella sampling); 要么顯著改變力場的勢能函數(scaled MD或者加速MD(aMD)。前一類方法要求預先提供感興趣運動的自由度,其前提是已經知道相關運動。后一類方法可能會高估勢能面(Free energy Surface)的高能區域,因此會探索構象空間的非物理區域。比如加速MD方法(aMD)就是在體系能量下降時改變盆地的相對高度,從而使FEL(Free energy landscape)局部變得平緩。

圖2:大規模構象變化和不同規模的采樣方法
圖片來源:Frontiers in Molecular Biosciences
馬爾可夫模型
為了改進這些方法,最近5年,基于馬爾可夫模型(MSM)的采樣方法逐漸流行,可以在毫秒級的時間尺度上采樣蛋白質動態。MSM本身是一種統計方法,串聯過渡來描述不同的狀態。MSM可以從一組較短的模擬中推斷出長期的動態變化,為采樣難題提供了又一個捷徑
如何在分子模擬中構造馬爾科夫模型(MSM)
建MSM模型,一般要選擇n個狀態,使得它們涵蓋了整個動力學行為,并且滯后時間τ足夠長以成為馬爾可夫模型,但又短得足以解決系統動力學問題。如果能夠成功做到這一點,則MSM僅從其過渡矩陣提供有關系統的有價值的信息, 如下圖所示,a圖表示的是八段不同的短時間的模擬軌跡,每一段模擬中可以選取不同幀的由一個模擬時間步分開。B圖表示將軌跡分解為若干離散狀態,其中已識別出四個狀態(綠色,藍色,紫色和粉紅色)。C圖表示的是觀察到的轉換計數矩陣,d圖是可逆轉換概率矩陣, e圖是總體概率分布的餅圖,這是概率矩陣的第一個特征向量。占比比較高的狀態在熱力學上也更趨于穩定。

圖3:馬爾可夫模型構建
圖片來源:J. Am. Chem. Soc.
方法與軟件
分子動力學模擬:AMBER16和GROMACS5.0
模擬軌跡分析與處理:MDTRAJ
MSM構建:PyEMMA 2.3.0
化學位移計算:ShiftX2和MultiEx
晶體結構優化: CCP4
結果


圖片來源:Chemical Science
在這項工作中,研究人員設計出合適的過渡態采樣流程(圖4b)。這是通過利用aMD高效探索構象空間的能力來實現的,同時依靠MSM程序來描述體系的更準確的熱力學和動力學行為。研究人員將aMD / MSM方法應用到人親Loop蛋白A(CypA)的勢能面搜索中。CypA酶是人類脯氨酰異構酶,將其摻入新的病毒裝配中對于HIV-1感染和HCV復制是必不可少的,這使它成為主要的藥物靶標。之前的研究揭示了變構調控的復雜網絡,這個酶具有兩個功能Loop,殘基65-77組成的70S loop(圖4a)和100-110殘基組成的100sLoop, NMR實驗發現它可在毫秒級的時間尺度上經歷動力學變化。研究人員探究了其中100s和70s回路在open 狀態和closed狀態之間的交換。

圖4:計算WT-CypA的動態運動過程
圖片來源:Chemical Science
為了能夠更好的研究勢能面,研究人員實施了一種基于氫鍵模式的設計策略,以穩定特定稀疏的具有毫秒時長的構象(圖5)。該過程使得研究人員發現了新的突變體D66A。WT的70sLoop主要處于閉合狀態,這與迄今為止已經解析的大多數CypA結構一致,而D66A預計將主要占據70sLoop的開放狀態。類似地,作為陰性對照,aMD / MSM預測突變H70A與WT非常相似。為了構建MSM模型,研究人員100個MSM微觀狀態匯總5個宏觀狀態模型中。這五個狀態的構象態勢揭示了100s和70s循Loop都可以采用“開放”和閉合”的構象。雖然兩個Loop的相互轉化在很大程度上是獨立的,但100sLoop的相互轉化比70sLoop的相互轉化快一個數量級(圖5d),這表明蛋白更慢的動力學行為和70s loop 的打開與閉合相關。為了驗證這些發現,研究人員找了一個突變位點,該突變可以穩定70S的開放構象(青色/藍色/紫色)?;陂_放和閉合的構象這兩種形式評估了每個殘基與70s loop形成的氫鍵數量(圖5B)。值得注意的是,發現D66在閉合構象中采用了大量的氫鍵,而在開放構象中的氫鍵數量則少得多(圖5C),這使該殘基脫穎而出,成為“可設計的”位點。隨后NMR的結果也驗證了H鍵數量差異的情況。?

圖5:突變的設計
圖片來源:Chemical Science
參考文獻:
1.Husic, B. E.; Pande, V. S. Markov State Models: From an Art to a Science. J. Am. Chem. Soc. 2018, 140, 2386-2396.
2.Orellana, Laura. 2019. “Large-Scale Conformational Changes and Protein Function: Breaking the in Silico Barrier.” Frontiers in Molecular Biosciences 6: 117.
3.?Juarez-Jime ? nez, J.; Gupta, A. A.; Karunanithy, G.; Mey, A. S. J. ?S.; Georgiou, C.; Ioannidis, H.; De Simone, A.; Barlow, P. N.; Hulme, A. N.; Walkinshaw, M. D.; Baldwin, A. J.; Michel, J. Dynamic Design:Manipulation of Millisecond Timescale Motions on the energy Landscape of Cyclophilin A. Chem. Sci. 2020, 11, 2670?2680.