
引言
不對稱催化是探索新的化學空間的一種方法,今天的計算能力足以協助這一探索。不幸的是,現有技術通常需要專業的計算知識而導致其未在合成化學中被充分利用。加拿大麥吉爾大學Nicolas Moitessier團隊聯合Molecular Forecaster公司和阿斯利康研發中心共同開發了Virtual Chemist平臺,實驗化學家僅需在電腦旁單擊幾下就可預測不對稱化學反應的結果。在1 kcal/mol的精度范圍內可指導化學家設計和發現不對稱催化劑。
背景
為設計新穎的有機合成方法以獲取新化合物,化學家通常利用大量有機化學工具來開展工作,盡管計算化學已被用于幫助解釋某些現象和提出新機制,但相比于NMR,MS和質譜來說,計算化學因需要編程知識而在合成化學領域較難被實驗人員運用。在該領域中,不對稱合成是產生大量高純度手性分子的有力方法,但僅用傳統的實驗技術去發現有機催化劑或過渡金屬催化劑來探索化學空間顯得十分具有挑戰性且乏味,迫切需要一款既簡單高效又準確實用的計算工具。
初步考慮及界面簡介
對有機化學家而言,一款工具必須在不犧牲準確性的情況下解決可訪問性的問題,該問題通過化學家與技術的交互來解決,例如指定特別想要的化合物屬性。理想情況下,一個平臺應該無縫執行所有三個發現催化劑的過程(準備潛在催化劑分子庫,評估催化活性,評估對映選擇性)而無需人工干預。作者擴展了他們的藥物發現平臺FORECASTER來創建一個新的平臺Virtual Chemist,該平臺的用戶界面(UI)包括一個2D結構繪制器用于輸入催化劑和底物結構,以及一個三維圖形界面用于可視化計算出的TS結構。UI中還匯總了所得數據(如,TS結構的勢能和對映選擇性)。整個工作流已變成一個通用模塊可以很好地被研究人員使用。

圖1.?二乙基鋅加成為醛的催化劑篩選流程
圖片來源:Nature Catal.
四種應用場景
1. 一對一設計
化學家可能希望一次測試一種催化劑以確定最有潛力的,在這種情況下,可以用2D繪制器繪制每個催化劑,TS模板可以直接使用或從文獻數據中構建。作者測試了7類反應中共超過350個反應并和隨機預測結果比較以評估方法準確性。發現,平臺的整體平均誤差在0.94~0.97kcal/mol,1kcal/mol是量化和催化反應的金標準。另外,平臺還能夠從良好的不對稱催化劑(90% e.e., ΔΔG??~1.4 kcal mol–1)中區分出差的(0% e.e., ΔΔG??~0 kcal mol–1),從極好的非對稱催化劑(99% e.e., ΔΔG??~2.8 kcal/mol–1)中區分出良好的。數據表明該平臺可用于通過與化學家的互動來評估不對稱催化劑,并促使開展更大規模的虛擬篩選。

圖2. A:七大類反應的TS態的2D和3D表示;B:一對一設計的準確性
圖片來源:Nature Catal.
2. 篩選手性分子庫
化學家可能正在尋找新的化學系列作為已知反應的催化劑,例如Shi環氧化和有機催化的Diels-Alder反應。作者從ZINC庫中為DA反應組裝了大約14萬個含手性胺的分子庫。通過計算分子描述符來篩選感興趣的分子(MW<500,不帶電荷,除去仲胺、醛和其他反應性基團),然后去掉與任何已知催化劑過于相似的分子并選擇最多樣化的分子,程序DIVERSE確保不遺留重復項,這樣最終剩下1307種候選催化劑進入下一輪篩選。對這些胺的評估分兩步進行,根據反應性過濾得到798個分子,由ACE計算各分子TS的立體選擇性,將6種催化劑加入到庫中以評估ACE回收這些結構的準確性。以相同的過程從手性酮開始搜索Shi環氧化催化劑,最后向庫中添加18種已知的立體選擇性催化劑。圖3表明大多數已知的立體選擇性催化劑的排名很高(圖3c,AUROC:Shi環氧化的為0.79,DA的為0.92),平臺可以篩選多種化學物質并發現新的化學系列的不對稱催化劑。

圖3.?篩選新型不對稱催化劑的準確性
圖片來源:Nature Catal.
3. 優化先導化合物
化學家可能有一個先導化合物需要優化結構以提高選擇性。合成了手性吡咯烷衍生物作為DA環加成反應的有機催化劑進行測試。先合成亞胺,然后使其與手性雙極性親核試劑反應生成三種潛在的非對映異構體,這些吡咯烷均在endo-Diels–Alder和exo-Diels–Alder環加成中進行評估,極大的減輕了實驗工作量。數據顯示該先導化合物優化的平均誤差低至0.33 kcal/mol,該項目在幾天內就可在標準PC上完成且可擴展到數百個類似物。

圖4.?DA環加成反應的不對稱有機催化劑的優化
圖片來源:Nature Catal.
4. 評估催化劑的底物范圍
化學家可以用平臺來評估給定催化劑的潛在底物范圍。該計算選擇(DHQD)2PHAL這種用于非對稱二羥基化反應的市售催化劑進行模擬。模擬結果表明,該催化劑在約25%的底物上具有很高的對映選擇性(≥97% e.e.),在約20%的條件下選擇性很差(≤40% e.e.),與實驗數據十分吻合。但與其他反應相比,二羥基化的結果重現性較差,這是由于用于該反應的催化劑分子更大更有柔性,這暗示了該方法的局限性。要充分搜索此類系統的構象空間,可能需要更多的時間和計算資源。每次計算運行5次,預測的對映體選擇性平均在67%~76%e.e.之間變化,而實驗值為73.6%e.e.,與實驗數據有良好的相關性(r2: 0.51~0.64)。
圖5.?使用(DHQD)2PHAL進行底物范圍的研究
圖片來源:Nature Catal.
小結
Virtual Chemist平臺旨在幫助實驗化學家更好地使用計算化學的工具完成不對稱催化項目。該平臺對用戶友好工作流程可以進行高度自定義且準確性已在4個實際方案中得到了證明。雖然會有基于MM的計算受限于當前FF限制和模擬可能陷入局部能量最小值的障礙,但大多數情況下,平臺能以較好精度識別出好的不對稱催化劑,化學家可在幾小時內測試自己的想法。
工具下載地址
www.molecularforecaster.com
參考文獻
Mihai Burai Patrascu, Joshua Potte, Sharon Pinus, Michelle Bezanson, Per-Ola Norrby and Nicolas Moitessier, From Desktop to Benchtop with Automated Computational Workflows for Computer-aided Design in Asymmetric Catalysis. Nature Catalysis, 2020, 3, 574–584. DOI: 10.1038/s41929-020-0468-3.