大家好~今天給大家帶來一篇腫瘤免疫相關的5分+乾濕結合生信文章。2020年3月發表在“Journal of Pathology”上,題名為“Molecular subtyping reveals immune alterations in IDH wild-type lower-grade diffuse glioma”。全文包含6個Figure和1個Table,接下來我們一起康康免疫相關的生信文章套路是如何應用的吧!
研究背景
本篇範文研究的主要問題是瀰漫性低度膠質瘤(LGG)。與膠質母細胞瘤(GBM, IV級)相比,其病程更為緩慢,且具有高侵襲性。異檸檬酸脱氫酶(Isocitrate dehydrogenase,IDH)野生型LGGs通常與預後不良有關。在WHO的新分類中,瀰漫性LGGs根據IDH突變和1p/19q 共同缺失狀態分為三個診斷和預後亞組。IDH野生型腫瘤以高級別(Ⅲ級)為主,預後最差,其次為IDH突變、無1p/19q共同缺失的腫瘤,其次為IDH突變、1p/19q共缺失的腫瘤(少突膠質細胞瘤)。但臨牀上,IDH野生型LGGs的結果與IDH野生型GBMs的結果難以區分,且比IDH突變型GBMs的預後更差。與此同時,還有研究證明了並非所有IDH野生型LGGs的存活率都很低。目前對IDH野生型LGGs的定義和分型仍有爭議。
因此,進行進一步分層分析,找到能夠劃分IDH野生型LGGs預後的標誌物是非常有必要的。有很多研究表明在腫瘤微環境中,膠質瘤不同分子亞型間存在差異,其中固有基因表達亞型的進化與微環境的免疫變化相關。且有研究發現具有間充質基因表達特徵的GBMs可能對免疫治療更敏感。目前,神經膠質瘤的免疫治療受到廣泛關注,更好地瞭解腫瘤免疫微環境對於提高免疫治療的療效至關重要。
數據解構
“圈”——無監督聚類分組及富集分析
第一步:無監督聚類分組
作者首先在基因表達譜比較的基礎上,利用R包“consensus susclusterplus”對從CGGA數據庫獲得的49個IDH野生型瀰漫性LGGs隊列中高度可變表達(MAD)> 1的2501個基因進行無監督聚類的亞型鑑定,並以熱圖的形式展示兩個主要亞型(Fig.1A)。接下來,使用R包“princomp”進行主成分分析(PCA)驗證這兩種亞型的表達譜存在顯著差異((Fig.1B)。並分析了這兩種亞型聚類的總生存期(OS)和無進展生存期(PFS),具有顯著差異(Fig.1C)。結果顯示Sub1患者的臨牀結果明顯較差,Sub2的總體生存期更長。且Sub2中包含更多的II級腫瘤。接下來作者以從TCGA數據庫中收集的73個IDH野生型瀰漫性LGG表達譜作為驗證集,以類似的基因排序再現了CGGA訓練集中確定的亞組聚類、PCA以及生存分析驗證(Fig.D-F)。
▲ (Fig.1)
第二步:功能聚類
作者對IDH野生型瀰漫性LGG的兩種亞型進行GO及GSEA富集分析以確定差異有統計學意義的基因集(Fig.2A-C),結果顯示,Sub1中高表達基因主要富集於免疫、炎症反應、抗原加工提呈等信號通路,並且該組患者免疫和炎症反應顯著增強。
為了進一步解釋這兩種亞型之間的免疫異質性,作者使用“estimate”R包計算基質細胞和免疫細胞的比例,推導每例患者的腫瘤純度,從而檢測各組間基質和免疫內容的分佈。以箱線圖的形式展示了基質、免疫、純度、細胞溶解和炎症評分的比較,以及人類白細胞抗原(HLA)基因的表達(Fig.2D-G)。結果表明,Sub1含有更多的免疫細胞。由於天然抗腫瘤免疫需要溶細胞性免疫應答,於是作者通過量化顆粒酶和PRF1的平均表達來計算免疫細胞介導的溶細胞活性,以評估細胞毒性免疫細胞活性。與免疫評分一致,Sub1腫瘤的溶細胞評分明顯高於Sub2。進一步,我們計算了腫瘤炎症信號算法,發現Sub1呈陽性。隨後為探究微環境中免疫細胞的比例,採用CIBERSORT算法研究了各組間浸潤性免疫細胞的組成。發現Sub1中M2巨噬細胞的富集程度較高,而Sub2腫瘤細胞中淋巴細胞、幼稚B細胞和漿細胞的富集程度較高(Fig.2H)。
▲ (Fig.2)
隨後在TCGA隊列中進行驗證,發現具有一致的富集結果及免疫差異(Fig.3)。
▲(Fig.3)
由於已知T細胞和NK細胞衰竭已被確定為癌細胞逃避宿主免疫的重要機制,作者隨後檢測了幾種明星分子的表達(LAG3、CTLA4、PD1、PD-L1和HAVCR2)。結果發現大部分明星分子在訓練集和驗證集的Sub1中都有高表達(Fig.S5A,B),這表明這些腫瘤的免疫衰竭水平升高。並進一步在12例來自CGGA隊列的石蠟包埋組織中,針對一些經典標記物進行IHC驗證(M2巨噬細胞的CD163;免疫溶細胞活性的GZMA;免疫衰竭的PD1和HAVCR2)。同樣,這些基因在sub1中蛋白表達水平較高。總的來説,這些結果在IDH野生型瀰漫性LGGs中發現了廣泛的免疫異質性。
▲(Fig.S5)
聯&靠——聯合免疫細胞標記,分析與IDH野生型瀰漫性LGGs預後相關的因素
作者接下來探討臨牀意義,分別以溶細胞信號和炎症信號評分對訓練集和驗證集進行分層預後分析,結果表明炎症評分高與不良預後相關,而細胞溶解活性可能在此腫瘤中不起作用(Fig.4A-B)。另一方面,儘管具有較高的免疫和溶細胞活性,但Sub1中免疫衰竭基因的高表達意味着免疫抑制狀態,這可能導致較差的預後。因此,作者接下來以相關性熱圖展示了炎症和細胞溶解特徵與M1、M2巨噬細胞、CD8 T細胞、中性粒細胞和記憶激活CD4 T細胞的相關性,以及炎症評分、溶細胞評分和免疫抑制基因(PD-1和CTLA4)之間可能存在相關性(Fig.4C-D)。這些發現提示炎症微環境和浸潤性溶細胞性細胞免疫應答可能影響IDH野生型瀰漫性低級別瘤變患者的預後。
▲(Fig.4)
挑&靠——差異分析
第一步:TCGA隊列中Sub1和Sub2之間基因組改變的差異分析
作者隨後分析了TCGA數據庫中的體細胞拷貝數改變(SCNVs)數據,以探討這兩種亞型之間基因組改變的差異。突變特徵提供了腫瘤發展的機制,結果發現兩組之間在突變頻率上沒有明顯的富集(Fig.5A)。但通過採用GISTIC 2.0分析兩組間拷貝數變化則具有顯著差異,Sub1顯示了更多缺失位點,如CDKN2A/CDKN2B、DMRTA1、C9orf53和MTAP(Fig.5B)。
▲(Fig.5)
第二步:篩選具有生存預後價值的差異分子
1. 差異分子篩選:
通過上述分層聚類分析,表明以上新的分類方法可能影響疾病預後。於是,作者利用Cox比例風險模型識別預後相關的信號,篩選基於TCGA隊列中Sub1和Sub2之間差異基因集。①採用SAM分析鑑定了1453個差異表達基因(FDR<0.05);②對差異基因進行單變量Cox迴歸分析,篩選出與生存相關的326個基因(Fig.6A);③採用Cox風險比例迴歸模型分析確定具有預後意義的基因,使用“glmnet”R包構建具有最佳預後價值的基因集(Fig.6B)。最終獲得5個基因簽名,採用基因表達加權迴歸係數(Coeffs)的線性組合來計算患者的風險得分(Fig.6C)。
Ps:這裏簡單介紹一下“SAM”,是基因芯片著性分析方法的簡稱,一個由Standford大學開發的免費軟件,用來篩選差異基因。其原理是將基因表達數據與臨牀特徵數據關聯,可以找到與該特徵相關性強的基因,再結合其他方法或數據進一步分析,以揭示共內在的生物學意義。並且SAM軟件在篩選得到較多差異基因的同時,FDR值還能夠保持在較低的水平,因而是一種非常理想的差異基因篩選工具,有興趣的小夥伴可以多多嘗試哦~
2. 臨牀預後分析:
根據風險評分的中位數將腫瘤分為低風險組和高風險組。Kaplan-Meier分析顯示,高危組患者預後明顯差於低危組(P<0.001,Fig.6D)。並在CGGA隊列中驗證這些基因簽名,得到一致的結果(Fig.6F-G)。並且對這些基因簽名和病理特徵進行聯繫,以風險評分將患者排序,發現在TCGA集合中按亞型、分級和EM/PM分級分層的病例的分別分析風險評分的分佈情況(Fig.6E)。
接下來,作者通過單因素和多因素Cox迴歸分析進一步評估了炎症信號的預後獨立性。如預期,獲得的基因簽名與患者總體生存顯著相關,且不受其他因素影響,表明上述分類在IDH野生型瀰漫性LGGs中具有預後意義(Table 1)。
▲(Table 1)
隨後,作者通過計算風險評分、年齡和分組的曲線下面積(AUC)來評估預測準確性。風險評分AUC明顯高於其他因素(Fig.6I)。這些結果證明了該特徵在預測預後方面的優越性能。
▲(Fig.6)
全文總結
本篇範文中,作者通過分層聚類的方法提出了一種新分類,用於實現基因型和表型的結合,從而把握不同分子特徵患者臨牀轉歸的同質性,以及膠質瘤診斷的異質性。通過分子病理學診斷彌補傳統組織病理學的不足,能夠更加精準地反映腫瘤特點。作者採用從CGGA和TCGA獲得的122例IDH野生型瀰漫性LGGs的轉錄組數據,將其進行聚類分析,定義了兩種具有不同臨牀和生物學特徵的亞型。並將該分類在另一個獨立的驗證集中重複驗證,觀察到一致的表型,以證明這個分層具有臨牀應用價值。進一步的GO和GSEA分析發現,Sub2顯著富集於化學突觸傳遞、神經遞質和穀氨酸等部分。因有研究表明神經迴路中的突觸和電整合促進膠質瘤進展,由此提示作者提出的分層在腫瘤進展中具有潛在應用價值。
接下來進入重頭戲——免疫預後分析。已知侵襲性膠質瘤的特徵是基質、免疫評分和細胞溶解活性較高,但純度較低,通過作者研究發現預後較差的Sub1病例在功能註釋上表現出相似的免疫表型,且免疫浸潤細胞分析富集於M2巨噬細胞(在膠質瘤中具有原核細胞活性);而Sub2中表現出幼稚B細胞和漿細胞的高水平浸潤(與膠質瘤患者良好預後相關)。同時發現無監督聚類的兩個IDH野生型LGGs的穩健亞型,具有不同的預後和免疫特徵。隨後,作者根據免疫相關評分確定生存預後相關的分子標誌物。並進行如Fig.6所示的預後分層分析,證明自己提出的這種分類在不同的治療策略及預後中具有臨牀意義,並可能影響IDH野生型瀰漫性LGG患者的靶向治療效果。
下面我給大家進行了免疫分子分型類生信文章套路總結:
學習過後,我們同樣可以將以上生信套路用於分析多種類型的數據,包括臨牀,SCNAs,基因突變,DNA甲基化和mRNA,miRNA,長非編碼RNA和蛋白質的表達等。
放眼望去,近幾年,很多人都有這樣一種感受,那就是現在的科研要求越來越高,論文發表越來越難。
這主要是因為當前競爭越來越大,優質科研成果及高水平論文越來越多,學術市場水漲船高。現在,要想在學術生涯獲得良好發展,手握高分論文已經成了通行證。這不僅是對科研人員,對碩博生們也是如此。對於碩博生們來説,優質的論文更是獲到學術自信,確保順利畢業、獲得滿意工作的決定因素,根本無法忽視。
但是説到這裏,很多人可能就抱怨了:現在發論文,真的很難很難啊!
所以,我很想把一個優質的課程推薦給大家!一個可能改變所有醫學生一生的課程。
10天領悟3分SCI套路