<em id="lbmtt"></em>
  • <th id="lbmtt"><track id="lbmtt"></track></th>
    <li id="lbmtt"></li>
    <progress id="lbmtt"><big id="lbmtt"></big></progress>

    JCIM | 結合自由能計算能否預測藥物選擇性?

    JCIM | 結合自由能計算能否預測藥物選擇性?

    引言

    當今煉金術自由能計算方法已經被廣泛應用于小分子先導化合物的優化過程中,計算精度已經達到了1 kcal/mol左右。盡管如此,在已發表的研究中使用自由能計算來推動作用于兩個相似靶標的化合物的選擇性優化方面相對較少。在最理想的情況下,配體結合位點的相似性可能會導致誤差的偶然消除進而可以比親和力更準確地預測其選擇性。在這里,結合人類激酶CDK2和CDK9之間非常相似的結合位點以及從另一個系列的配體中找到針對關系相對較遠的激酶CDK2和ERK2的選擇性配體的基礎上,本文系統性地評估了針對小分子激酶抑制劑選擇性預測的準確性。通過使用貝葉斯分析方法,作者將系統誤差與統計誤差分開,并對選擇性靶標之間系統誤差的相關性進行量化,進而發現在CDK2/CDK9的例子中,系統誤差的高度相關性表明自由能計算可以對化學家實現選擇性帶來較大幫助,而在更遠相關的激酶(CDK2/ERK2)中,系統性誤差的相關性表明在不那么密切相關的系統之間甚至可能發生偶然的消除(fortuitous cancellation)。在這兩種情況下,系統誤差的相關性都表明更長時間尺度的模擬有利于適當地平衡統計誤差與系統誤差,以充分利用選擇性預測中自由能計算精度提高的優勢。

    選擇性是藥物設計中的重要考慮因素

    除了效能(potency)外,選擇性也是藥物開發中重要的特性??刂七x擇性不僅可以避免脫靶毒性(抑制非預期靶標),而且還可用于避免靶上毒性(抑制預期靶標)。在任一種情況下,考慮化合物的選擇性都會因靶標的生物學而變得復雜。例如,激酶作為復雜信號網絡中的節點存在,具有反饋抑制和路徑間的串擾。仔細考慮哪些脫靶被抑制可以避免由于減輕反饋抑制作用而引起的脫靶毒性,以及通過緩解串擾抑制而無意中重新激活了靶途徑或次級途徑的上調。脫靶毒性也可能是由于抑制不相關的靶標,例如吉非替尼(一種EGFR抑制劑),也抑制CTP2D6,從而對肺癌患者造成肝毒性。在癌癥環境中,可以通過考慮激酶的致癌突變體形式相對于野生型形式的選擇性來避免靶向毒性,例如許多第一代EGFR抑制劑。

    激酶是選擇性預測重要

    且極具挑戰性的模型系統

    激酶是一種有用的可以用來評估自由能計算在藥物發現背景下預測抑制劑選擇性的效能的模型。隨著伊馬替尼在2001年批準用于治療慢性粒細胞性白血病,靶向小分子激酶抑制劑(SMKIs)已成為治療癌癥和其他疾病的主要療法。目前,已有62種FDA批準的SMKIs,且針對激酶的療法占當前藥物開發的50%。盡管已經獲得了許多成功的藥物批準,但目前FDA批準的激酶抑制劑僅靶向與疾病有關的一小部分激酶,而針對新型靶點設計新的選擇性激酶抑制劑仍然是一項重大挑戰。這主要是由于有超過518種蛋白激酶共享大多數SMKIs靶向的高度保守的ATP結合位點。雖然激酶抑制劑已設計為靶向激酶特異性亞口袋和結合模式以實現選擇性,但先前的研究表明,I型(與活性DFG-in構象結合)和II型(與無活性DFG-out構象結合)抑制劑能夠實現一定范圍的選擇性,除了其主要靶標外,通常還表現出與許多其他靶標的顯著結合。

    煉金術自由能方法

    可用于預測化合物的選擇性

    盡管配體i對單個靶標的效價通??梢员涣炕癁榻Y合的自由能(ΔGi),但仍有許多不同的指標可用于量化化合物的選擇性。在這里,我們將一個目標與另一個目標(一個反目標)之間的選擇性Si視為兩者之間給定配體i的結合自由能之差。

    JCIM | 結合自由能計算能否預測藥物選擇性?

    在優化效能時,我們關注的是ΔΔGij≡ΔGj–ΔGi,即配體i和j與單個目標結合的相對自由能,而在選擇性的優化中,我們關注的是ΔSij≡Sj–Si,反映了配體i和相關配體j之間的選擇性變化。

    JCIM | 結合自由能計算能否預測藥物選擇性?

    為了預測兩種相關化合物之間選擇性ΔSij的變化,我們開發了一種使用相對結合自由能計算(FEP+)來構建同類型中配體之間的煉金術擾動圖的方法。對于每個感興趣的目標,每個配體(節點)之間具有相同的擾動(邊緣),每個邊緣代表一個相對的煉金術自由能計算,該計算量化了單個目標的配體(節點)之間的ΔΔG。通過這些計算,我們可以計算出兩個感興趣的目標之間的選擇性變化ΔSij,這是通過將配體i轉換為配體j來實現的。由于每個目標的模擬計算是分開的,如果我們假設兩個目標的系統誤差均按照雙變量正態分布進行分布,其中相關系數ρ量化了相關程度(其中ρ=0表示不相關,ρ=1表示完全相關,ρ=-1表示完全反相關)和兩個目標(σstat,ij,target)的統計誤差是完全獨立的,我們可以將預測ΔSij的誤差建模為σ選擇性。

    JCIM | 結合自由能計算能否預測藥物選擇性?

    系統誤差的相關性

    可以顯著提高選擇性預測的準確性

    為了證明相關系數ρ對使用煉金術自由能技術預測選擇性的潛在影響,我們根據等式3建立了一個簡單的數值模型,其中考慮了每個目標系統誤差(σsys,ij,1和σsys ,ij,2),如圖1A所示,如果每目標系統誤差的大小相同(σsys,ij,1 =σsys,ij,2),則即使單目標效能系統誤差為非零,σ選擇性也將接近0,而相關系數ρ接近1。如果自由能方法的誤差在大小上不相同(σsys,ij,1≠σsys,ij,2),則σ選擇性變小,但隨著ρ接近1而接近非零值。同時為了量化達到所需的選擇性閾值而必須合成的化合物數量的預期減少量(以下稱為選擇性優化中的加速作用),我們對多種化合物的選擇性相對于參考化合物的變化進行了建模。藥物化學家可能會建議以0為中心的正態分布,標準偏差為1 kcal/mol(圖1B,黑色曲線),這反映了這樣一種觀念,即大多數提議的修飾都不會驅動選擇性的大變化。合成化學家的方案分配可以建模為正態分布的這一假設是基于Abbott實驗室對效能變化分析的數據驅動估算得出的。合成所有預測具有1.4 kcal/mol或更高的選擇性(親和力比為10倍)的化合物,并使用具有完美測量精度的實驗技術進行實驗測試(圖1B,彩色曲線)??梢杂嬎愠雠c原始分布相比具有真正的1.4 kcal/mol選擇性提高的化合物比例的倍數變化,可以作為預期加速比的替代物。對于這個1.4 kcal/mol的選擇性提高閾值,相關系數ρ= 0.5給出了4.1倍的預期加速比,這可以解釋為需要減少4.1倍的化合物以使選擇性提高10倍。此過程可以擴展為實現選擇性提高100倍的效果(圖1C),其中可以預期200-300倍的提速,具體取決于單目標系統誤差(σsys,ij,target)。如圖1D所示,更嚴格的合成規則與高相關系數(ρ)相結合,只要已經對足夠的化合物進行了打分,自由能計算對設計選擇性抑制劑的影響最大。有趣的是,在相關系數ρ=0.75且打分化合物較少的情況下,與1000x合成規則相比,500x合成提供了更高的加速比。這是因為在對更多化合物進行打分之前,沒有任何化合物符合更嚴格的1000x合成規則。這對藥物發現工作顯然是有影響的,因為時間和計算資源可能會限制能夠用自由能方法分析的化合物的數量。?

    JCIM | 結合自由能計算能否預測藥物選擇性?

    圖1 自由能計算可以加速選擇性優化

    圖片源自JCIM.

    CDK2/CDK9抑制劑的實驗數據集

    證明了實現高選擇性的難度

    為了評估自由能預測中誤差與選擇性的相關性,我們著手收集符合許多標準的數據集。我們收集的數據集除了包含具有相同配體的每個靶標的晶體結構外,還包含許多激酶靶標和配體的結合親和力數據?;诩っ?配體相互作用指紋和結構(KLIFS)數據庫中鑒定的85個結合位點殘基的多序列比對,CDK2和CDK9具有57%的序列一致性。對于此CDK2/CDK9數據集,根據在同行論文中發表的工作,將配體12c與CDK2/cylin A(圖2A,左)和CDK9/cyclin T(圖2B,左)共結晶。在CDK2和CDK9中,配體12c與激酶形成相對少的氫鍵相互作用。對配體12c的親和力稍低的CDK9(圖2C,右)在配體12c的磺酰胺基團和殘基E107之間形成相互作用。另一方面,CDK2在配體12c的磺酰胺基團與殘基K89和H84之間形成相互作用。同類的配體系列包含許多困難的擾動,尤其是在取代基R3處(圖2C,左)。

    這一同類的配體系列還突出了使用公開數據進行工作的兩個挑戰:首先,選擇性的動態范圍非常窄,平均值S(CDK9–CDK2)為-0.65 kcal/mol,標準偏差僅為0.88 kcal/mol,使得該數據集的總動態范圍為2.8 kcal/mol。其次,沒有報告實驗測量的實驗不確定性。該數據集報告了使用Km(ATP)測得的CDK2和CDK9的IC50計算得出的Ki值,以及使用Cheng-Prussof方程進行測定得出的[ATP]。因此,因此,對于這組配體和后續配體,根據先前所做的總結實驗數據不確定性的工作,假設沒有系統實驗誤差,則隨機實驗不確定性假定為0.3 kcal/mol。

    JCIM | 結合自由能計算能否預測藥物選擇性?

    圖2 CDK2/CDK9數據集展現密切相關的激酶之間的選擇性優化

    圖片源自JCIM.

    CDK2/ERK2抑制劑的實驗數據集

    如何實現了更高的選擇性

    基于KLIFs結合位點殘基的多序列比對,CDK2和ERK2具有52%的序列一致性,使其與CDK2和CDK9(57%)的關聯度略低。雖然所有這三種激酶都屬于CMGC家族,并且在系統發育樹中密切相關,但CDK2和CDK9屬于CDK(細胞周期蛋白依賴性激酶)亞家族,而ERK2是鄰近的MAPK(促分裂原激活的蛋白激酶)亞家族的一員。從結構的角度來看,本研究中使用的兩個激酶PDB對也非常相似。結合位點的疊加顯示, CDK2/CDK9對的RMSD僅為0.81?,而CDK2/ERK2對的RMSD僅為0.92?。CDK2(圖3A,頂部)和ERK2(圖3B,頂部)的晶體結構都可與配體22共同結晶而獲得。其中CDK2采用DFG-in構型,其中的α-C螺旋向外旋轉,遠離ATP結合位點,并破壞了K33和E51之間的保守鹽橋,表明該激酶是無活性的。相比之下,來自CDK2/CDK9數據集的CDK2結構采用DFG-in構型,其中旋轉了α-C螺旋,由于細胞周期蛋白A的變構激活,在K33和E51之間形成了指示活性激酶的離子鎖。

    這兩種激酶之間的結合模式相似。在配體的骨架和一個鉸鏈殘基的主鏈之間(CDK2為L83,ERK2為M108)存在一組保守的氫鍵。保守的賴氨酸(CDK2為K33,ERK2為K54)通常參與與α-C螺旋形成離子鎖的過程,在CDK2和ERK2中均與配體骨架形成氫鍵(圖3A,B,底部)。但是,在ERK2結構中,羥基與CDK2結構中不存在的氫鍵網絡中的結晶水以及N154有相互作用。同類配體系列具有單個溶劑暴露的取代基。這有助于解釋選擇性的狹窄分布,其平均選擇性為-1.74 kcal/mol(ERK2-CDK2),標準偏差為0.56 kcal/mol;該數據集的總動態范圍為2.2 kcal/mol。盡管較小的標準偏差表明用R-基團取代難以驅動選擇性,但總動態范圍表明R-基團取代可以顯著提高選擇性。

    JCIM | 結合自由能計算能否預測藥物選擇性?

    圖3 CDK2/ERK2數據集展現相對不相關的激酶之間的選擇性優化

    圖片源自JCIM.

    系統誤差的相關性加速了選擇性優化

    為了量化靶標之間系統誤差的相關系數(ρ),我們建立了貝葉斯圖形模型以將系統誤差與統計誤差分開,并量化我們對ρ估計值的置信度。CDK2/CDK9計算顯示出強有力的相關性,相關系數為0.69(圖4A,右)。盡管每個靶標系統誤差較高,但CDK2/CDK9計算的錯誤高度相關性導致1 log10單位選擇性優化的速度提高了3倍,2 log10單位選擇性優化的速度提高了10倍。CDK2/ERK2計算的相關系數ρ量化為0.48,表明誤差在ERK2和CDK2之間有中等相關性(圖4B,右)??紤]到加速模型中其中打分和合成的化合物數量不受限制,對于CDK2/ERK2計算,適度的相關性和較低的每個靶標系統誤差允許1 log10單位選擇性優化的預測的4-5倍加速和2 log10單位選擇性優化的30-40倍加速。?

    JCIM | 結合自由能計算能否預測藥物選擇性?

    圖4 靶標之間系統誤差的相關性可以顯著加速選擇性優化

    圖片源自JCIM.

    總結

    1) S是先導化合物優化中選擇性的有用指標。有許多不同的指標用于量化化合物的選擇性,最早的指標之一是標準選擇性分數,還有采用熱力學方法來研究激酶的選擇性。在這里,我們提出了一種更精細的從熱力學角度來說明選擇性的方法,即可以使用自由能計算方法直接計算:兩個不同靶標之間給定配體的結合自由能的變化(S),其目標是使用物理模型來改善或維持先導化合物系列中的選擇性。

    2)系統誤差相關可以加速選擇性優化。盡管預期的加速取決于該方法的每個靶標的系統誤差,但加速也高度取決于兩個目標的誤差相關性。在更實際的情況下,打分和合成的化合物數量受到資源的限制,我們已經證明了使用相同的數值模型,更嚴格的合成規則會導致自由能計算的加快。

    3)兩對激酶測試系統表明系統錯誤可以關聯。盡管CDK2和ERK2屬于不同的激酶亞家族,但系統誤差中的計算相關性表明,與同一亞族中密切相關的激酶相比,偶然消除誤差可能適用于更廣泛的場景。這可能是由CDK2和ERK2之間相對較高的結合位點序列一致性驅動的(52%,而CDK2/CDK9為57%)。但是,相關性的置信區間很寬,這表明與更遠距離相關的蛋白質的誤差將只有中等相關性。

    4)當系統錯誤相關時,減少統計錯誤是有益的。除非相關系數ρ對兩個感興趣的靶標高度正相關,否則運行更長時間的計算不會有太多好處。但是,當通過相關性減少系統誤差時,較長時間的計算可以幫助實現加速的大幅增加,以實現提高選擇性的目標。在進行化合物制備和測試預測時,對自由能計算保持ρ的連續定量化,可以決定進行更長時間的計算是否值得。

    5)更大的蛋白質靶標數據集將對未來的工作十分有用。本文收集的數據集受到化合物總數、選擇性(S)的小動態范圍以及缺乏可靠的實驗不確定性的限制。小的數據集使得很難得出關于系統誤差相關性的廣泛結論。要了解基于結構或序列相似性的先驗相關程度,需要研究的靶標范圍比本研究中介紹的兩對靶標更大,包含許多蛋白質靶標、晶體結構和定量結合親和力數據的較大數據集將是十分理想的。本工作表明系統誤差中的相關性可以允許自由能計算,以促進藥物發現項目選擇性優化中的顯著加速。

    參考文獻

    Steven K. Albanese, John D. Chodera, Andrea Volkamer, Simon Keng, Robert Abel, and Lingle Wang. Is Structure-Based Drug Design Ready for Selectivity Optimization? J. Chem. Inf. Model. 2020. DOI: 10.1021/acs.jcim.0c00815

    X
    亚洲网络在线,五月亚洲色图,亚洲 色 图 小 说,亚洲一级a毛片免费视频在线播放