

世界上第一個基于網絡的用于存儲、管理和共享描述生物大分子間復雜相互作用的片段分子軌道計算數據集的公共數據庫——FMO數據庫。
背景介紹
了解蛋白質和候選藥物之間的分子相互作用,對于設計有效的蛋白靶向藥物是必不可少的。傳統的蛋白質配體相互作用包括:氫鍵、靜電相互作用,π-相互作用和疏水相互作用,這些相互作用通??捎梅肿恿W力場和經驗規則預定義的公式來描述。然而,自20世紀90年代以來,人們發現了具有量子力學(QM)作用特征的CH/π、硫原子和鹵素原子相互作用。但由于目前確定蛋白質-配體相互作用的公式,很大程度上依賴于分子力場,尚未充分考慮QM計算數據,因此,可能存在一些潛在的重要相互作用尚未被發現或定義不清的情況。為了成功檢測所有相互作用并準確預測相互作用能值,必須進行從頭計算QM。
當進行生物大分子,如蛋白質配體配合物的從頭計算QM時,通常需要巨大的計算成本。為了解決這一問題,研究人員開發了片段分子軌道(fragment molecular orbital, FMO)方法,該方法采用帶片段的多體展式技術,降低了計算成本,使研究人員能夠高效地進行從頭算QM計算。FMO方法的另一個優點是,可以計算片段-片段相互作用能值,即片段間相互作用能(IFIE)和對相互作用能分解分析(PIEDA)值,以及靜電(ES)、色散相互作用(DI)、交換排斥(EX)和高階混合項電荷轉移(CT+mix)能量對這些值的相對貢獻,這些數值對于詳細分析蛋白-配體和蛋白-蛋白相互作用是有用的。
目前,雖然許多獨立的研究小組都進行了FMO計算和分析,但主要是在藥物發現和結構生物學領域,而且計算出來的FMO數據通常在研究結束后不會面向公眾公布。近年來,計算機性能的提高使得進行大量的FMO計算成為可能,預計在不久的將來會積累大量的FMO數據。
主要內容
來自日本東北大學和星薬科大學的Kaori Fukuzawa以及日本理化研究所的Daisuke Takaya & Chiduru Watanabe & Teruki Honma等人開發了FMO數據庫(FMODB),這是世界上第一個用于存儲、管理和共享描述生物大分子之間復雜相互作用的FMO計算數據集的公共數據庫。數據庫中的每一項都包含了有關背景數據,如數據是如何編譯的、每個分子系統的總能量和片段間相互作用能(IFIE)以及對相互作用能分解分析(PIEDA)值。目前,該數據庫包含了13600多套FMO計算數據集,并在前端實現了全面的搜索功能,同時,介紹了靶向蛋白的篩選、實驗結構的預處理、數據庫的構建以及數據庫前端的詳細內容。隨后,研究者通過比較FMO方法和分子力學方法得到的氫鍵、離子對和XH/π相互作用的IFIE值分布,證明了FMODB的應用有效性。通過比較,數據的統計分析為三種類型的相互作用提供了標準參考值,這將有助于確定給定系統中的每一種相互作用相對于FMODB數據中包含的相互作用是強是弱。最后,研究者演示了使用數據庫來檢查鹵素原子對人組織蛋白酶L及其抑制劑之間的結合親和力的貢獻。研究發現,由PIEDA導出的靜電項與含鹵素的組織蛋白酶L抑制劑的結合親和性密切相關,表明了定量分析鹵素相互作用的QM計算的重要性。相關的研究成果以“FMODB: The World’s First Database of Quantum Mechanical Calculations for Biomacromolecules Based on the Fragment Molecular Orbital Method”為題發布在國際著名期刊Journal of Chemical Information and Modeling上。
數據庫公開訪問地址
https://drugdesign.riken.jp/FMODB/
網站首頁:?

FMODB的構造
在本研究中,FMO計算的結構包括了X射線晶體學、核磁共振、低溫電子顯微鏡、M模擬快照以及建模結構獲得的實驗結構。FMO計算前的預處理,可以通過專用軟件手動或自動進行。在這里,由FMODD或BINDS的參與研究人員進行手工預處理,并根據每個研究人員打算如何使用FMO計算數據集選擇特定的預處理方法(例如,結合親和預測或分子識別分析)。作為手動預處理的替代方案,FMODD的開發工作組啟動了一種自動預處理方法,該方法被稱為Auto-FMO協議(圖1)。?

圖 1. 自動FMO協議對片段分子軌道(FMO)計算結構進行預處理的工作流程。圖片來源于JCIM
研究者構建了一個基于web的前端,允許用戶可以輕松地查看每個條目的分子結構、注釋以及IFIE和PIEDA數據。為了證明FMODB的有效性,研究者進行了統計分析,定義了IFIE和PIEDA的幾個分子間和分子內相互作用的標準參考值。
氫鍵、離子對和π-軌道相互作用的檢測結果如下:
首先,利用MOE中的prolig_Calculate函數,通過幾何定義的相互作用指紋(IFP)識別片段對間和分子內的相互作用,該指紋根據原子類型、原子間距離和取向角檢測不同的相互作用。
其次,通過幾何IFP分析,定義原子對相互作用的距離如下:圖2顯示了在ERα和17β-雌二醇復合物中檢測到的相互作用示例(PDB ID: 1ERE;FMODB ID: 5 p4np)。

圖 2. 在雌激素受體α (ERα)和17β-雌二醇(PDB ID: 1ERE;基于幾何相互作用指紋分析的FMODB ID:5P4NP)。圖片來源于JCIM
最后,為了檢驗每一種相互作用的能量分布,研究者通過IFP檢測到的原子與FMO計算中構建片段對的原子之間的對應關系,將幾何IFP分配給基于FMO-和MM-的片段對相互作用能。
截至2020年9月9日,共對13667組蛋白質靶點進行了FMO計算,包括1468個獨特的PDB條目;13239次FMO計算在Auto-FMO協議下進行(表1)。

表 1. FMO數據庫中的數據集列表。表格來源于JCIM
分子間和分子內相互作用的統計分析
通過如圖3所示的過程選擇片段對的數據集進行評估。研究者從1486個X射線晶體結構中選取了912932個片段對,它們的距離在vdW半徑的2.0倍以內(不采用二聚體ES近似),并通過Auto-FMO協議進行計算。最終獲得了612477對含有氫鍵相互作用的片段對,15801組離子對相互作用,102720組 XH /π相互作用,3406組陽離子/π相互作用,394組π -π相互作用(圖2)。?

圖3. 選擇具有指定幾何相互作用指紋的片段對,以及對分子間和分子內相互作用的能量分解和片段間相互作用能的統計分析。圖來源于JCIM
hCatL與一系列鹵化抑制劑的相互作用分析
圖4顯示了hCatL蛋白與氫化或鹵化配體(X = H, F, Cl和Br)之間的相互作用示意圖。將hCatL蛋白分解為單個氨基酸殘基。配體在Cys25處與蛋白質共價結合,從蛋白質中分離出來,分成三個片段。配體中的鹵素原子(X)通過鹵素鍵或氫鍵與Gly61主鏈C短鍵長的O原子相互作用,作用距離為3.31 ?。單個氨基酸殘基在主鏈上的Cα和C短鍵長的O之間被剪切,而不是在sp2雜化的酰胺鍵上(圖4,左上)。?

圖4. 人組織蛋白酶L蛋白(hCatL)的Gly61(主鏈的O原子被認為屬于Asn62片段)與氫化(X = H)或鹵化(X = F、Cl或Br)配體之間的相互作用示意圖。圖來源于JCIM
圖5a總結了hCatL的Asn62片段與各種鹵化配體(X = F, Cl或Br)或氫化配體(X = H)相互作用的FMO-IFIE數據。由于CH-O氫鍵的形成,氫化產物具有吸引力的相互作用能(IFIE:?2.87 kcal/mol)。另一方面,在原子對距離為3.50 ?的情況下,由于O和F原子負電荷之間的靜電斥力,氟化化合物具有+1.19 kcal/mol的排斥能。盡管有負極性的鹵原子和氟原子,氯代和溴代配體依然表現出穩定的相互作用能(IFIE:?2.12和?3.16 kcal/mol)。圖5a中的ES組分清楚地表征了這些相互作用的穩定性,表明存在σ-空穴。

圖5. 人類組織蛋白酶L蛋白Asn62片段與氫化或鹵化配體相互作用的片段間相互作用能(IFIE)及其分解(PIEDA)值,由(a)片段分子軌道或(b)分子力學計算確定。圖來源于JCIM
MM-IFIE值為靜電和范德華相互作用的總和,使用了MOE中的Amber10:EHT力場(圖5b)。在FMO數據中觀察到的σ-空穴的穩定性沒有被MM計算捕獲,所有鹵代化合物都顯示出明顯的靜電斥力。這一發現證明了FMO方法優于MM方法的一個優點。
氫化物(X = H)通過靜電作用與Gly61的C=O產生相當大的相互作用,作用距離為3.68 ?;該配體的IC50值為0.29 μM,其活性遠低于計算結果。
總結
本文報道了世界上第一個基于FMO方法的生物大分子量子力學計算數據庫FMODB的開發。FMODB于2019年2月20日啟動,包括一個用于搜索和瀏覽數據庫的web前端,最初發布的數據包含了2000多個蛋白質結構的總能量、IFIE和PIEDA數據。利用FMODB中目前記錄的數據,研究者比較了FMO方法和MM方法計算的氫鍵、離子對和XH/π相互作用的能量分布。
未來,FMODB可以幫助結構生物學家和藥物化學家等實驗研究者定量地理解分子識別,并通過簡單的QM數據來改進藥物設計。研究者們將繼續更新PDB結構的FMODB數據。除了蛋白配體配合物,研究者還計劃涵蓋質子泵抑制劑和核酸的計算數據。
參考文獻
Takaya, Daisuke, et al. “FMODB: The World’s First Database of Quantum Mechanical Calculations for Biomacromolecules Based on the Fragment Molecular Orbital Method.” J. Chem. Inf. Model. 2021, 61, 2, 777–794. https://doi.org/10.1021/acs.jcim.0c01062