

背景介紹
隨著機器學習(ML)軟件(scikit-learn、TensorFlow、PyTorch等)的廣泛使用以及圖形處理單元成本和速度的不斷提高,ML作為一種預測工具變得非常流行并在諸多方面獲得了成功。在過去的十年中,ML已經應用于量子物理和化學的各種原子模擬工作中。這些工作主要包括以下幾個方面:1)用于材料設計或發現的化學空間探索;2)用于分子動力學的力場函數設計;3)密度泛函理論(DFT)的函數設計;4)相關能量預測。此外,也有使用ML模型本身來表示波函數的應用,如使用神經網絡來描述電子的多組態相互作用?;蛘呤褂肕L來構建波函數,如使用神經網絡來進行選擇性組態相互作用(SCI),各種SCI方法對組態選擇有不同的標準,但其核心都是解決所選組態的變分空間中的特征值問題。SCI方法通常依賴于某種形式的擾動理論來執行選擇。ML為選擇組態的擾動理論提供了一種不同的替代方案,從而產生一種與現有SCI截然不同的SCI方法?;诖?,在本文中作者構建了Chembot方法,一種實現選擇性組態相互作用的機器學習方法。
主要內容
來自勞倫斯利弗莫爾國家實驗室的Sergio D教授提出了一種基于機器學習的選擇性組態相互作用方法,稱為Chembot,它利用了許多新的選擇方法進行了模型的設計和訓練。這些選擇包括:使用支持向量機(SVN)選擇重要的組態,使用電荷密度矩陣和組態能量作為特征,使用啟發式算法來提高訓練數據的質量。該文章使用了斯萊特行列式并在MolPro Version下進行了計算。通過測試Chembot進行組態相互作用的能力,發現了該方法在更少的迭代收斂、更少的變分空間中的行列式以及更少的重要組態下卻可以計算相同的能量,絕對優于基于蒙特卡羅的組態相互作用。此外該文章闡述了Chembot的原理及方法,并進行了簡單的測試及應用。相關的成果以?“Chembot: A Machine Learning Approach to Selective Configuration Interaction”?為題發布在著名理論計算期刊J. Chem. Theory Comput.上。
圖表匯總

圖1. Chembot算法的示意圖。圖片來源于JCTC
?

圖2. 特征向量分析圖。圖片來源于JCTC
?

表1. H4的基準方法和FCI之間的能量誤差。表格來源于JCTC

表3. 水的基準方法與FCI溶液之間的能量差。表格來源于JCTC
推薦理由
該文章開發了一種名為Chembot的基于ML的SCI方法,可以有效地選擇重要的組態迭代地構建波函數。該方法使用SVM作為ML模型,使用電荷密度矩陣和能量作為訓練特征、并通過啟發式方法對數據進行訓練。該方法的亮點在于它使用CAS波函數作為初始訓練集而非CISD波函數,其波函數的計算也是基于Epstein-Nesbet微擾理論。此外,該文章的測試結果表明Chembot在組態選擇效率等方面均具有良好的表現。
參考文獻
Sergio D. Pineda Flores, Chembot: A Machine Learning Approach to Selective Configuration Interaction, Journal of Chemical Theory and Computation, 2021, ASAP. DOI: 10.1021/acs.jctc.1c00196.