差异表达基因热图怎么看_获得差异表达基因后-基因功能注释

用一句话来概述基因功能注释的话,则是将symbol映射至ENTREZID,并进一步关联到GO、KEGG或GSEA。第一步:加载包 library(DOSE)
library(GO.db)
library(org.Hs.eg.db)
library(topGO)
library(GSEABase)
library(clusterProfiler)
没安装的请自行安装
第二步:symbol--->ENTREZID
###上调基因注释
gene <- resSig_up$symbol
gene = bitr(gene, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
org.Hs.eg.db基于symbol到ENTREZID的conversion所使用的数据库。
此外,
ENTREZID与众多文献数据相关联,
并作为后续功能注释的重要参考资料。
因此必须进行ID转换以确保后续操作的准确性。
第三步:GO和KEGG注释
###细胞组分
ego_CC <- enrichGO(gene = gene$ENTREZID,
OrgDb= org.Hs.eg.db,
ont = "CC",
pAdjustMethod = "BH",
minGSSize = 1,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
readable = TRUE)
###生物过程
ego_BP <- enrichGO(gene = gene$ENTREZID,
OrgDb= org.Hs.eg.db,
ont = "BP",
pAdjustMethod = "BH",
minGSSize = 1,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
readable = TRUE)
###分子功能:
ego_MF <- enrichGO(gene = gene$ENTREZID,
OrgDb= org.Hs.eg.db,
ont = "MF",
pAdjustMethod = "BH",
minGSSize = 1,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
readable = TRUE)
pdf(file="ego_MF.pdf")
该R脚本段落中调用了barplot()函数进行数据可视化操作;其中主要参数设置包括指定展示类别的数量(showCategory=20)、设定图表标题(title="EnrichmentGO_MF")以及启用绘图中的空缺值填充功能(drop=T);此外还附加了注释说明该图表的具体呈现方式。
dev.off()
pdf(file="ego_BP.pdf")
dotplot(ego_BP,title="EnrichmentGO_BP_dot")#点图,按富集的数从大到小的
dev.off()
也可以一步到位:
go <- enrichGO(gene = gene$ENTREZID, OrgDb = org.Hs.eg.db, ont='ALL',
pAdjustMethod = 'BH',
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,keyType = 'ENTREZID'
)
dim(go)
dim(go[go$ONTOLOGY=='BP',])
dim(go[go$ONTOLOGY=='CC',])
dim(go[go$ONTOLOGY=='MF',])
gbarplot(go,showCategory=20,drop=T)
dotplot(go,showCategory=50)
###KEGG分析
kk <- enrichKEGG(gene = gene$ENTREZID,
organism ="human",
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
minGSSize = 1,
#readable = TRUE ,
use_internal_data =FALSE)
pdf(file="barplot_kk.pdf")
barplot(kk)
dev.off()
pdf(file="dotplot_kk.pdf")
dotplot(kk)
dev.off()
