免疫微环境、免疫细胞浸润分析、免疫功能分析
Immune MicroEnvironment、Immune infiltration analysis
-
- 肿瘤免疫微环境(TIME)
-
- TIME的免疫特性及其作用机制
-
- 免疫浸润特征的检测技术
-
3.1 基于标记基因的多组学富集分析方法
- 3.1.1 xCELL等多组学平台
- 3.1.2 Monoclonal Antibody-based Counter
- 3.1.3 Expression Status Estimation Tool (ESTIMATE)
- 3.1.4 Gene Set Enrichment Analysis (GSEA)
- 3.1.5 Sparse Significance Enrichment Analysis (ssGSEA)
- 3.1.6 ImmuneCell AI平台
-
3.2.基于反褶积算法的免疫细胞浸润分析方法
-
- 3.2.1.TIMER2.0
- 3.2.2.CIBERSORT
- 3.2.3.EPIC
-
3.3.免疫浸润分析算法的组合使用
-
- 3.3.1.用热图展示多种免疫浸润算法分析结果
参考来源: https://www.omicsclass.com/article/1437
https://www.bilibili.com/read/cv22219799/
1.肿瘤免疫微环境(TIME)
肿瘤微环境(Tumor Microenvironment, TME)是指存在于肿瘤周围的复杂环境系统
目前流行的观点认为"种子与土壤"理论是描述肿瘤发生的最佳模型
其中起主要作用的是肿瘤相关成纤维组织(CAFs)
在免疫浸润过程中树突状白细胞巨噬白细胞NK白细胞及不同亚型T淋巴细胞性别参与其中
特别值得注意的是肿瘤相关巨噬白 cell (TAM)与常规巨噬白 cell (M1)不同
在当前的研究数据显示近八年pubmed收录的TME相关文章数量持续攀升
tumor基质成分间的相互作用形成了功能复杂的tumor microenvironment
CAFs主要分布于血管周围或肿瘤外周纤维间隙中并分泌间质因子ECM成分及相关酶分子
在TME中聚集的各种免疫浸润细胞性别各自发挥着不同功能
CD8+ Tc cells(CTCs)作为杀伤效应T淋巴细胞性别发挥杀伤功能
而调节型T淋巴细胞性别(Treg)则通过抑制效应增强自身免应性从而实现免疫抑制效果
通常情况下M1型巨噬白 cell 具有促炎抗瘤特性然而在tumor microenvironment中的特异巨噬白 cell (TAM)却表现出不同的特征成为M2型巨噬白 cell 通过分泌Th2因子类间质因子促进血管生成和恶性肿瘤侵袭倾向
NK white cells 在常规情况下能够释放颗粒酶和穿孔素从而消灭靶癌细胞然而在tumor microenvironment中富集的Transformed growth factor-beta (TGF-β) 则会抑制其杀伤活性效果
2.TIME的免疫特点和相关机制
由于TME的异质性,在不同个体中 tumor 的进展情况呈现出显著差异;通常将 tumor 的 immune 微环境划分为 immune 暂存区与炎症区两种类型。在炎症区中,则聚集着活化的 T 细胞以及髓系细胞;此外还伴随趋化因子及 I 类干扰素信号的存在。相比之下,在 immune 暂存区中只含有少量的免疫相关细胞或抑制性亚群(如 Treg、MDSC 及 TAM),而不具有向 tumor 微环境有效渗透的能力
3.免疫浸润的检测工具
肿瘤侵袭情况起到决定性作用于癌症治疗效果及患者预后。
通过研究肿瘤微环境中的免疫细胞组成可阐明其异质性特征。
通过RNA-seq技术进行基因表达谱分析可表征相关基因的表达谱信息,并已被广泛应用于不同类型的癌症研究中。
尽管RNA-seq能够提供基因表达数据但无法直接反映免疫浸润情况需借助特定算法进一步分析。
现有用于免疫浸润评估的相关算法可分为两大类:
(1)基于标记基因(marker gene)的方法用于肿瘤浸润免疫细胞的量化;这种方法通过分析组织样本中这些特征基因集的表达水平来进行富集分析或汇总到丰度评分中以独立推断每种细胞类型的得分;其中代表性的软件包括TIminer、xCell和MCP-counter等工具;此外还有如ESTIMATE这样的评定免疫得分的应用程序;
(2)基于特征基因集的方法则采用不同的策略进行计算;其中一种是基于GSVA算法构建ssGSEA模型;该方法将不同免疫细胞对应的marker genes定义为特定的基因集合;然后采用类似于GSEA(Gene Set Enrichment Analysis)的方法来分析样本中高表达的基因在这些不同免疫细胞对应的基因集合中的富集情况。
(2)该研究开发了一种基于基因表达特性的反褶积方法用于肿瘤浸润免疫细胞的量化分析。该方法推导出一个数学模型,这种模型能够将组织样本基因表达表示为种群混合体中各细胞类型的加权平均值。这些互补算法在识别不同癌症中的特定免疫细胞类型时展现出各自的独特优势;这些工具包括CIBERSORT、TIMER、EPIC以及quanTIseq等
3.1.基于marker gene的ssGSEA富集分析的免疫分析方法
该方法以不同免疫细胞对应的marker genes为基本单元, 借鉴GSEA算法原理, 对样本中的高度表达基因在各免疫细胞中的分布情况进行统计分析与富集效应评价。其主要研究工具包括SSGSEA、xFastCell、MCP-Counter及ESTIMATE系统等
3.1.1.xCELL
xCell(访问地址:http://xcell.ucsf.edu/)是一种基于ssGSEA的分析工具。它能够根据不同类型的免疫细胞及基质细胞的基因表达数据进行相应的富集分析。其输入文件来源于人类混合样本的基因表达矩阵(其中每一行代表一种基因、每一列代表一个样本)。若所使用的基因表达数据源自于microarray技术,则无需进行标准化处理。当涉及测序平台获取的数据时,则要求将原始数值转换为基于gene length的比例值。该工具采用基于expression level的数据排序方式,在后续处理中不需要额外的归一化步骤。该方法特别适用于涉及gene expression谱和RNA-seq数据分析的任务场景,在单个细胞层面的应用则不适用
作者:尔云间 https://www.bilibili.com/read/cv22219799/ 出处:bilibili
xCell(http://xcell.ucsf.edu/)是一项于2017年发表在《Genome Biology》期刊上介绍的基于单基因集外推法(ssGSEA)的方法开发平台。该分析平台能够计算出涵盖64种免疫细胞类型丰度分数的数据指标,并包含适应性免疫细胞、先天免疫细胞、造血祖细胞、上皮细胞以及间质基质等各类细胞类型的信息
xCell来源于对FANTOM5、ENCODE、Blueprint、IRIS以及Human Primary Cell Atlas (HPCA)等研究中提取的489个基因集的大规模表达数据分析(相关研究者包括Novershtern等人)。通过四个关键步骤计算xCell丰度得分:
(1)利用R包GSVA执行单基因集ssGSEA分析;
(2)对所有属于同一细胞类型的基因集效应量取平均值;
(3)将特定平台效应量转换为丰度评分;
(4)采用类似于流式细胞术数据分析中的spillover方法校正紧密相关的细胞类型之间的相关性。尽管xCell丰度评分不能直接解读为真实细胞比例的数据点,但其与实际细胞分布的相关性极为显著。
3.1.2.MCP-counter
MCP-counter(https://github.com/ebecht/MCPcounter)是由Becht团队开发的一个R软件包,在2016年推出。该软件包通过分析标准化的转录组测序数据来评估不同组织样本中8种免疫细胞及2种基质细胞的丰度分布特征。其分数值能够反映其在免疫微环境中所处的位置,并且不同样本间的细胞丰度不可直接比较。
MCP-counter(链接:http://github.com/ebecht/MCPcounter)是一种于2016年发布于《Genome Biology》期刊上的基于标记基因组数据量化肿瘤浸润免疫细胞、成纤维细胞以及上皮细胞丰度的方法。对于每个样本中的不同组织类型(如肿瘤、成纤维细胞及上皮组织),其表达水平通过各自特异性基因的几何平均数进行评估。值得注意的是,在这种情况下所得出的数值指标并不具备绝对意义。尽管如此,在后续研究中我们发现这些估计值与实际观察到的结果呈现出极强的相关性。为了验证这些预测具有临床价值,请问您是否感兴趣?
3.1.3.ESTIMATE
该方法通过基因表达特征分析推断恶性肿瘤样本间质与免疫细胞的比例;其全称为基于基因表达数据分析恶性肿瘤组织中间质与免疫细胞比例的评估方法(评估方法基于基因表达数据分析);该算法采用ssGSEA方法分别对间质基因组与免疫基因组进行评分;计算出该样本对应的间质得分(stromal score)与免疫得分(immune score),将两者相加即可获得estimation值;此值可用于评估肿瘤组织中纯度的程度。
Estimate是一种用于测定肿瘤微环境中免疫相关性状的方法工具,该方法首次于《Nature Communications》期刊上发表,旨在测定肿瘤微环境中免疫相关特征的具体数值,包括免疫相关区域、肿瘤基质以及免疫微环境的相关指标。该方法通过基于能够表征基质和免疫细胞的各种基因集及其表达水平的数据进行计算得出具体数值
基于TCGA数据库中各平台检测的样本表达量数据获取了包含10412个基因的基因集,并通过筛选确定了基质信号基因集及免疫信号基因集各包含141个基因。利用这两个基因集的表达量结合ssGSEA算法计算得到了Stromal分数与Immune分数两个指标值;将这两个分数相加即可获得ESTIMATE分数值。这三个指标分别反映了免疫微环境中基质细胞比例、免疫细胞比例以及肿瘤纯净度等特征信息
3.1.4.GSEA
GSEA 算法源自于 GSVA 算法,请问您了解 GSVA 吗?原始文献(参考链接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3618321/)对 GSVA 进行了详尽的阐述。
A brief overview of the GSVA method is presented in Figure 1.
This approach requires two primary inputs:(1) A data matrix X={xij}p×n containing normalized expression values (see Methods for details on preprocessing steps) for p genes across n samples, where typically p≫n,
(2) A collection of gene sets Γ = {γ₁,…,γₘ}.The expression profile of each gene will be denoted as xi.
For any given gene i and sample j, its specific value is represented as xij.
Each subset γk corresponds to a group of genes forming a pathway or functional unit within X.
The size of γk is given by |γk|.The subsequent steps are detailed in References.
参考文献:
Hänzelmann et al. introduced GSVA as a method to analyze gene set variations in microarray and RNA-seq datasets. The technique was published in the journal BMC Bioinformatics in January 2013, specifically in volume 14, issue number 7.
3.1.5.ssGSEA
单样本基因集富集分析(single-sample gene set enrichment analysis, ssGSEA),最初是为了解决单个样本无法进行标准基因集富集分析(Gene Set Enrichment Analysis, GSEA)而开发的方法。该方法于2009年首次提出(Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1)。通过GSVA R包能够实现这一功能,并且目前该方法常用于评估肿瘤免疫细胞侵袭程度。
3.1.6.ImmuneCellAI
该平台是一个免疫细胞丰度综合分析网络系统(http://bioinfo.life.hust.edu.cn/ImmuCellAI#!/),能够基于ssGSEA算法对基因表达数据集中的24个免疫细胞浸润情况进行估算,并进一步预测患者的治疗反应。其中这24个免疫细胞性别构成较为丰富,在T淋巴ocyte领域涵盖了18种T细胞亚型以及6种其他类型的免疫细胞性别组合:包括B cell、NK cell、monocytic cell、macrophage、neutrophil和DC cell等群体特征性分布情况。值得注意的是该系统的界面设计较为美观,并且配有多幅精美图片以辅助信息呈现对于初次接触该领域的新手用户而言非常友好
作者:尔云间 https://www.bilibili.com/read/cv22219799/ 出处:bilibili
3.2.基于反褶积算法的免疫细胞浸润分析方法
该方法将每个样本视为由多种免疫细胞组成的混合体,并利用线性回归模型确定了各免疫细胞在混合样本中的比例及其对应的表观表达水平与整体结果之间的关系。研究者借助反卷积算法提取了各免疫细胞在样本中的表观特征,并特别指出,在实际应用中最为常用且广泛应用的三种免疫浸润分析方法包括 TIMER2、CIBERSORT 和 EPIC。
3.2.1.TIMER2.0
TIMER 2.0 (http://timer.cistrome.org/) 是 TIMER 软件的新版本,在线访问功能强大且互动性强的 tumour immunology 研究平台。该网站不仅提供肿瘤免疫浸润免疫细胞的数据分析能力,并且还支持数据可视化功能。此外,在线发表于《Nucleic Acids Research》期刊上的相关研究论文(影响因子 11.1)也值得参考。
TIMER2.0版本主要由Immune模块、Exploration模块和Estimate模块组成,在支持用户手动输入RNA-seq数据中的基因TPM标准化值的基础上,默认完成预处理后即可运行程序;该系统整合了TIMER、xCell、MCP-counter、CIBERSORT、EPIC及quanTIseq等六款软件的优势特点,在此基础上为120种与免疫微环境相关的细胞分别计算出其得分;此外,在结合TCGA数据库的基础上进一步完成了全部样本数据通过上述六款软件计算出相应的免疫得分,并提供了丰富的可视化在线工具。
TIMER应用基于反褶积算法从基因表达谱中计算肿瘤浸润性免疫细胞(TIICs)的数量级。 TIMER 2.0 (http://timer.cistrome.org/ )作为TIMER软件的升级版,在线提供一个交互式的网络平台,在此基础上实现了肿瘤免疫浸润细胞分析及可视化展示功能。 TIMER 2.0 版本集成了 Immune、Exploration 和 Estimate 三大功能模块,并支持用户直接输入经过TPM标准化处理后的RNA测序数据作为分析基础。 此外该系统还整合了包括xCell、MCP-counter、CIBERSORT、EPIC和quanTIseq等多种方法的数据资源,并基于此方法体系为120种与免疫微环境相关的细胞类型提供了具体的评估分数;同时该软件还系统地对TCGA数据库中的全部样本开展免疫浸润特性分析,并通过多种在线工具提供了直观的数据可视化功能
3.2.2.CIBERSORT
基于microarray数据构建了特征矩阵C来描述22种免疫细胞表型及其各自的表达特征X(包括不同类型的免疫细胞及其功能状态)。该算法通过核范数最小化方法(\nu-SVR)估计单一同调性(monotonicity)约束下每个样本对应的潜在分数值c_i。通过对杂交瘤细胞悬浮培养液中提取的人体血液和淋巴结活检样本进行评估,在9个免疫系统亚群分类任务中达到了97%以上的准确率(\text{ACC}=0.97)。此外,在模拟实验中发现该算法对于不同类型恶性肿瘤组织样例均表现出良好的稳定性表现
该分析工具以2.3万的引用次数位居行业前列,并于2015年首次发表于《自然·方法学》杂志上。该工具通过应用线性支持向量回归模型来分离免疫细胞亚型的表达数据,并推算出各免疫细胞群体的数量特征。该分析工具整合了包含22种典型免疫细胞群的数据集LM22。其升级版CIBERSORTx不仅能够基于单核苷酸测序数据生成特异性标记基因集合(每种免疫细胞的独特标志),还能够预测各组分免疫细胞的关键基因表达谱序列,并将研究重点转向分子机制探索。
作者:尔云间 https://www.bilibili.com/read/cv22219799/ 出处:bilibili
3.2.3.EPIC
根据expression data analysis, 可以推导出涵盖8种特定的免疫细胞性别, 包括B淋巴细胞性别, 肿瘤相关成纤维细胞性别(CAFs), CD4+ T淋巴细胞性别, CD8+ T淋巴细胞性别, 内皮细胞性别, 巨噬细胞性别以及NK淋巴细胞性别. EPIC算法的核心思路是利用约束最小二乘回归方法, 在反卷积问题中明确引入非负性约束条件, 并确保每个样本中各cell的比例总和不超过一. 其相对简单易用;只需提交RNA-Seq测序数据后进行参数设置即可完成整个流程.
3.3.免疫浸润分析算法的组合使用
3.3.1.用热图展示多种免疫浸润算法分析结果
该文章包含一个完整的内容编号(mid),其具体数值为...
