
一個機器學習(ML)框架可利用基于網絡的分析來識別ICI治療生物標志物(NetBio),并做出穩健的預測。
背景介紹
在過去的幾年中,免疫檢查點抑制劑(ICIs)大大改善了癌癥患者的臨床治療。不過一個主要的局限性是,只有少數患者對免疫治療有反應(在實體腫瘤中~30%),且ICI治療后可能發生毒性。急需一種方法來識別在給藥前就能檢測免疫治療應答的生物標志物,提供ICIs臨床使用的信息,并提高癌癥患者的生存率。
許多研究報道PD-L1表達與非小細胞肺癌的ICI反應呈正相關。然而,令人驚訝的是,其他研究報道PD-L1表達與ICI治療反應之間沒有顯著相關性,一些研究甚至顯示ICI應答者表現出較低的PD-L1表達水平。需要確定新的生物標記物,以穩健地預測免疫治療反應。因此,必須開發出成功的方法來識別ICI治療患者的生物標志物,并最終使ICI治療的效益最大化。
網絡生物學,為識別可靠的生物標志物提供了一種強有力的手段。具有相似表型作用的基因傾向于在蛋白質-蛋白質相互作用(PPI)網絡的特定區域共定位,這一趨勢已被用于識別比單基因方法更能預測表型結果的基因模塊。此外,研究者之前曾報道過,利用患者衍生的類器官模型的藥物基因組學數據,可以通過網絡鄰近性識別預測癌癥患者總體生存的藥物反應生物標志物??傊?,證據表明,基于網絡的方法提供了預測性和低噪聲的生物標志物,但該方法預測大量癌癥患者對ICI治療反應的有效性尚未被驗證。
主要內容
韓國浦項科技大學&延世大學的Sanguk Kim等人提出了一個機器學習框架,該框架利用基于網絡的分析來識別ICI治療生物標志物(NetBio)。研究者整理了700多例ICI治療的患者樣本,包括臨床結果和轉錄組數據,并觀察到基于NetBio的預測,準確預測了三種不同癌癥類型的ICI治療反應——黑色素瘤、胃癌和膀胱癌。此外,基于NetBio的預測優于基于其他傳統ICI治療生物標志物的預測,如ICI靶標或腫瘤微環境相關標志物。
基于網絡的免疫治療反應預測綜述
基于之前的工作,作者通過選擇ICI靶標附近的通路來識別與ICI反應相關的生物通路(圖1a, b)。STRING PPI網絡(STRING score >700)包括16,957個節點和420,381條邊。首先,研究者采用網絡傳播,使用ICI靶標(例如,nivolumab的PD-1或atezolizumab的PD-L1)作為種子基因,在網絡上傳播ICI靶標的影響(圖1a)。網絡傳播的一個特點是,越接近ICI靶標的節點影響分數越高。接下來,研究者選擇了影響分數高的基因(top 200基因),并鑒定了這些基因富集的生物通路(Reactome pathway)(圖1b)。通過使用所選擇的生物通路來預測免疫治療反應,并將這些通路視為網絡生物標記物(NetBio)。
為了進行基于ML的免疫治療-反應預測,研究者使用NetBio作為輸入特征;陰性對照使用了基于基因的生物標志物(即免疫治療靶基因)、基于腫瘤微環境的生物標志物或從數據驅動的ML方法中選擇的通路(圖1c)。為了使用監督學習來訓練ML模型,研究者使用不同的訓練數據集和測試數據集的組合來廣泛地衡量預測性能的一致性。研究者進行了(i)研究內預測,其中訓練和測試數據集來自單個隊列;或(ii)跨研究預測,其中兩個獨立的數據集用作訓練和測試數據集(圖1d)。

圖1. 一種基于網絡的機器學習方法來識別免疫治療相關的生物標志物。圖片來自Nat. Commun.
研究內交叉驗證表明,基于NetBio的ML可以對ICI治療反應和總生存期做出一致的預測
NetBio的轉錄組可以做出一致的預測性能來預測ICI反應(圖2)。相比之下,當使用藥物靶標表達時(例如,PD-1用于尼魯單抗和派姆單抗,PD-L1用于atezolizumab, CTLA4用于伊匹單抗治療的患者),預測性能較差。使用NetBio訓練的ML模型,在所有4個數據集中始終保持準確的預測,而使用藥物靶標表達水平做出的預測不太一致,藥物靶標僅在黑色素瘤隊列中可準確預測。
此外,在三個具有總生存數據的數據集中,使用基于NetBio的ML預測為ICI應答者的患者的總生存時間持續延長。

圖2. 免疫治療患者藥物反應和總生存期的預測。圖片來自Nat. Commun.
接著,研究者將NetBio的預測性能與之前確定的其他ICI相關生物標志物進行了比較,發現在大多數情況下,研究者的方法在所有四個癌癥數據集上都更好(圖2h-o)。
跨研究預測表明,基于NetBio的ML可以在其他獨立的黑色素瘤數據集中做出一致的預測
一個精確的ML模型的關鍵方面包括:(i)它的泛化能力;(ii)它在訓練樣本很少的情況下的一致性。為了測試ML模型的泛化性,研究者使用Gide等人的黑色素瘤數據集來訓練ML模型,并在三個獨立的黑色素瘤數據集上測試其預測性能(圖3a)?;贜etBio的ML在兩個外部數據集中顯示AUCs >0.7(圖3b, c;Auslander AUC = 0.79;Prat AUC = 0.72),其余數據集為0.69(圖3d;Riaz)。與基于BetBio的ML相比,使用其他生物標記物的預測顯示出高度變化的預測性能(圖3b-d)。?

圖3. 三個獨立的黑色素瘤數據集的預測性能。圖片來自Nat. Commun.
基于NetBio的預測優于純數據驅動的特征選擇方法
與純數據驅動的ML預測相比,基于NetBio的ML模型,能夠持續提高預測性能(圖4)。具體來說,對于數據驅動的ML模型,研究者選擇了訓練數據集中最能區分應答者和非應答者的K個數字特征(其中K等于NetBio的數量),并使用所選特征訓練ML模型(圖4a)。在11個不同的任務中,發現基于NetBio的預測表現出明顯優于基于ML的特征選擇(圖4b;t檢驗P = 3.3×10?3)。?

圖4. 基于機器學習的特征選擇的預測性能比較。圖片來自Nat. Commun.
此外,在對黑素瘤隊列進行預測時,均觀察到了性能改善(跨研究預測;圖4c),表明網絡引導選擇有助于減少ML模型的過擬合。這表明,可以通過利用基于網絡的生物標志物選擇來識別可靠的轉錄組生物標志物。
?
基于NetBio的預測再現了TCGA數據集中的免疫微環境
研究者使用Gide或Liu數據集(黑色素瘤隊列)預測TCGA數據集(TCGA SKCM)中黑色素瘤患者的ICI反應,Kim數據集(胃癌隊列)預測TCGA胃癌(TCGA STAD), IMvigor210數據集(膀胱癌隊列)預測TCGA膀胱癌(TCGA BLCA)患者,并將預測的藥物反應與(i)腫瘤突變負擔(TMB)或(ii) TCGA患者的免疫環境相關(圖5a)。
基于NetBio的預測成功地再現了免疫微環境(圖5b)。正如預期的那樣,Gide和Liu隊列表現出相似的免疫微環境特征,與白細胞比例、CD8 t細胞比例呈高度正相關,與M2巨噬細胞比例呈高度負相關(圖5b)。

圖5. 基于NetBio的預測再現了免疫微環境。圖片來自Nat. Commun.
研究者進一步研究了哪些NetBio通路,與免疫細胞比例高度相關。在使用Liu數據集時,在最重要的通路中(前10個特征重要系數為負),FGFR信號通路與CD8 T-細胞比例的相關性最高,該通路的表達水平與細胞比例呈負相關(圖5d)。
NetBio通路表達水平與膀胱癌患者的免疫細胞浸潤有關
研究者使用了不同的免疫表型,包括(i)免疫沙漠(少于10個CD8 T細胞),(ii)排除(CD8 T細胞鄰近腫瘤細胞),和(iii)浸潤(CD8 T細胞接觸腫瘤細胞)表型,并將趨化和吞噬途徑的表達水平與免疫表型進行了比較(圖6b, c)。?

圖6. NetBio通路在膀胱癌中的表達水平與基于免疫組化的免疫表型一致。圖片來自Nat. Commun.
與免疫荒漠或排除表型相比,免疫浸潤表型表現出最高的通路表達水平(圖6b, c;Mann-Whitney U P < 0.05),提示NetBio通路可捕獲膀胱癌白細胞浸潤分數。研究結果表明,NetBio可以持續揭示與免疫治療反應相關的免疫微環境的通路。
將 NetBio 與 ML 模型中的腫瘤突變負荷 相結合,可以提高對接受 PD-L1 抑制劑治療的膀胱癌患者的預測
雖然高腫瘤突變負荷(TMB)水平與ICI治療的獲益增加相關,但ICI應答者和無應答者的TMB水平往往有顯著重疊,這表明僅TMB不足以預測ICI療效。因此,研究者測試了將NetBio與基于TMB的預測器相結合是否能提高預測性能(圖7a)。
結合NetBio表達水平和TMB改善了atezolizumab治療膀胱癌患者的總生存預測。atezolizumab是一種PD-L1抑制劑。使用LOOCV預測ICI治療反應,僅使用TMB訓練ML模型,預測有反應組和預測無反應組之間的1年生存率差異為18%。當同時使用TMB和NetBio時,1年生存率差異增加到22.3%。
Raf激活通路在兩個亞組間表達顯著差異。從PPI網絡來看,Raf激活通路的成分包括HRAS、KRAS和JAK2與PD-L1的直接相鄰(圖7e),這表明該通路可能在藥物治療過程中發揮機制作用。
研究者測試了當(i) PD-L1表達低,模擬PD-L1抑制,以及(ii) TMB水平高時Raf激活是否影響總生存。在PD-L1表達低、TMB水平高的膀胱癌患者中,Raf激活通路對總生存率有統計學顯著影響(圖7f;P = 0.025)。?

圖7. 結合基于網絡的轉錄組特征和TMB提高了atezolizumab治療膀胱癌患者的總生存期預測。圖片來自Nat. Commun.
總結
本文測試了基于網絡的生物標志物發現管道是否可以對免疫治療做出穩健的預測?;贜etBio的ML表現出一致的預測性能,優于基于GeneBio、TME-Bio的預測或純數據驅動方法。該工作能夠為使用ICI治療的精準醫療提供有趣且新的研究機會。
參考文獻
Kong, J., Ha, D., Lee, J. et al. Network-based machine learning approach to predict immunotherapy response in cancer patients. Nat Commun 13, 3703 (2022). https://doi.org/10.1038/s41467-022-31535-6