查看: 10765|回复: 8

快来领取全套的富集分析相关图形详解吧!(上篇)

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
626
注册时间
2020.6.16
在线时间
372 小时

发表于 2020.12.7 10:00:28 | 显示全部楼层 |阅读模式
本帖最后由 基迪奥-Jt桃 于 2020.12.7 10:14 编辑

上期我们介绍了《转录组图形专题之差异基因相关图形介绍》,下面接着来说说富集分析相关图形介绍。

在生物学研究中,无论是转录组研究,还是重测序、10X单细胞研究,只要涉及到与基因相关的组学,都是想要在获得一个目标基因集后,将这些基因与其相关的生物学功能联系起来。这时候就要使用富集分析的方法,对目标基因进行归类,将有相同功能的基因集中在同一个通路中。然后根据自己实验设计的目的和文献查阅,找到相关的显著通路,最后根据通路中的基因注释和表达量,找出核心基因,作为候选基因进行后续的分子验证实验。

但是找出相关的显著通路还需要将数据可视化,用图形显示富集分析结果,可用于文章发表,让读者对分析结果一目了然。下面由小编一一介绍富集分析相关图形的应用及绘制方法,主要有柱形图,气泡图,圈图,z-score图,网络图

由于微信文章篇幅有限,还是有说不清楚的方面,这里推荐大家来基迪奥5.0版转录组培训班学习,该课程系统全面,内容丰富,能让您对转录组分析有更深层次的认识(课程表见下篇文末)。

柱形图

柱形图是一种以长方形的长度为变量的统计图表,一般包括柱状图和条形图。在转录组富集分析中应用频率较高的图形就有柱状图和条形图,如下图1所示的一些例子。

图1 常见的柱形图

注:a图是GO注释结果的二级分类柱状图;b图是GO富集分析条形图;c、d图是KEGG注释结果的二级分类条形图,区别在于一级分类名称在图中展示位置不同。

从上图可以看出柱形图可以展示GO和KEGG的注释分类及富集分析结果。其中a图是GO二级分类图,横坐标代表GO三个ontology的一级分类,第一个为生物学途径(BP),表示分子功能的有序组合,以达到更广的生物功能,如有丝分裂或嘌呤代谢等;第二个为细胞组份(CC),表示用于描述亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等;第三个为分子功能(MF),表示用于描述基因、基因产物的功能,如碳水化合物或ATP水解酶活性等。

GO的更细一级的分类为二级分类,一般情况共有55个分类。纵坐标代表每个二级分类条目所包含的上调和下调的基因数目。由于一个基因通常会对应多个GO Term,因此同一个基因会在不同分类条目下出现,即被多次统计,因此如果你把这里所有柱子的基因数目加起来,肯定是多于你输入的基因集的总基因数目。

例如一个基因的产物是细胞色素c(cytochrome c),那么这个基因的产物Molecular Function描述为氧化还原酶活性,被Biological Process描述为氧化磷酸化,被Cellular Component 描述为线粒体基质和线粒体内膜,这样一来就会出现一个基因对应3个GO Terms的情况。因此从a图中我们就可以知道有多少基因被注释到了各个GO Terms。该图形主要应用在GO注释二级分类,或者将它的横纵坐标进行转置,用条形图也可以展示(如图2)。

图2 GO注释分类二级条形图

图1 b为GO富集分析条形图,横坐标为基因数目占比,纵坐标为GO Term及每个GO号的详细信息。图中不同颜色深度代表不同基因数目,颜色从深到浅,基因数量逐渐减少。该图形主要应用在GO或KEGG富集分析,当然还可以变化横轴的指标,展示出不同的分析结果(如图3 a)。

图3 富集分析条形图

注:图3 a为GO富集分析的前20条目;b为KEGG富集分析的前20通路。

图1 c、d表示KEGG注释二级分类条形图,其中纵坐标是一级分类,共有7大类,分别为新陈代谢、遗传信息加工、环境信息加工、细胞过程、生物体系统、人类疾病、药物开发,而在图c中只有5大类,原因是该图展示的是植物的KEGG注释分类,所以在图中没有人类疾病和药物开发。不同的颜色字体表示二级分类。横坐标表示基因数目,图中不同柱子长度表示KEGG二级分类的基因数目,柱子越长,该分类的基因越多。图d是KEGG注释分类的另一种图形展示,它将一级分类名称在图形的右边显示。

图形绘制:

绘制柱形图的方法很多,这里推荐用OmicShare Tools绘制。

富集分析条形图:
https://www.omicshare.com/tools/Home/Soft/enrich_bar

动态富集条形图:

https://www.omicshare.com/tools/ ... ort_enrich_bar.html

KEGG富集分析:

https://www.omicshare.com/tools/Home/Soft/pathwaygsea

GO富集分析:

https://www.omicshare.com/tools/Home/Soft/gogsea

气泡图

气泡图由于有不同颜色或大小的圆圈,形似气泡而得名。它可以展示四个变量之间的关系,与散点图有相似的性质,在富集分析中应用广泛。

如图4、5所示,x轴是Rich Factor,对应的就是结果表格中的“%”一列,表示筛选的基因集富集到该通路的基因数目与背景基因富集到该通路的基因数目的比值,所以比值越大,富集到该通路的基因数目越多;

y轴是富集出来的通路名称,一般根据P-value或Q-value从小到大排列顺序,挑选富集通路前20或30的通路来绘图;点的大小表示Gene数目,点越大,表示富集到该通路的基因越多;点的颜色渐变最为重要,代表P值的高低,P值越小,表示该通路越显著。

例如图4所展示的KEGG通路富集结果,可以从图中找到富集因子越大、点越大、颜色越红的点,所以图中比较显著的生物学意义的富集通路有核糖体(Ribosome)、内吞作用(Endocytosis)、氨基酸生物合成(Biosynthesis of amino acids)等。

图5所示的GO富集分析结果中,同样选取富集因子大、点大、颜色较红的条目来作为显著富集结果,例如图中有显著的生物学意义的条目有真菌液泡(fungal-type vacuole)、储存液泡(storage vacuole)、细胞芽(cellular bud)等。不过挑选显著通路不仅要看图说话,最主要的还是要根据自己实验的研究目的来综合筛选显著通路或条目,最终解释自己实验设计的生物学问题。

怎么样挑选和自己研究课题相关的通路呢?这里分两种情况:第一种是研究正常生命活动与非正常生命活动的一些生理活动的相关基因,例如研究逆境下,盐碱地、干旱、低温等胁迫与正常生长比较来筛选差异基因,那这种情况的富集结果通常就可以看图说话,得到与逆境或胁迫下的显著相关通路,如氨基糖和核苷酸糖代谢(Amino sugar and nucleotide sugar metabolism)、DNA修复和蛋白质重组(DNA repair and recombination proteins)、淀粉和蔗糖代谢(Starch and sucrose metabolism)等。

第二种是研究某生理现象,如自然条件下的雌性工蚁的生殖发育,或共生真菌与植物共生过程中的营养物质交换等,他们在不同的生命活动周期中所表达的基因也不同,此时我们可能更关心与实验设计相关的基因表达,但这些基因表达会影响正常生命活动,导致在筛选差异基因的时候会出现大量与生命代谢相关的基因而遮挡了一些与实验相关的基因,所以在富集分析中我们会忽略与生命代谢相关的通路(在图中表现为点大,P值较小)而关心一些与该实验相关的通路(这些通路可能会富集的基因数目少,点小)。

那这些通路的详细信息可以通过前期查阅文献得知,如刚才所说的雌性工蚁的生殖发育相关的重要通路为Ras信号通路(Ras signaling pathway)等。共生真菌与植物共生过程中的营养物质交换的显著富集通路可能为脂肪酸生物合成(Fatty acid biosynthesis)、植物-病原菌互作(Plant-pathogen interaction)、膜转运(Membrane trafficking)、钙信号传导(Calcium signaling pathway)等。

图4 KEGG通路富集的前20个通路气泡图

图5 GO富集的前20个条目气泡图

图中还有其他一些问题,如有些图中是用P值检验,有些是Q值检验,这两种检验值的用法对初学者较为迷惑的。什么是P值呢?P值就是在进行富集分析时利用超几何检验计算出来的结果。Q值是计算得到的P值进一步经过多重检验校正后的值。所以一般情况下Q值比P值的检验更严格。

这时候也可以分两种情况,第一种是经过Q值的检验筛选后得到了与实验设计相关的通路,那此时就可以用Q值来绘图。第二种是经过Q值检验没有得到满意的结果,那可以换P值检验,得到与实验相关的通路。

在图4和图5中我们看到,图例中显示的P值形式不一样,图4是正常数值显示,图5 是对P-value取10的对数的负值来显示,他们应用的场景主要看P-value的大小,如果像图5那样的P-value非常小时,就可以对数据归一化处理;如果数据较大,但又小于0.05时,可以不用对数据做处理(如图4所示)。

图形绘制:

由于该图形使用频率非常高,绘制该图形的方法也非常多,这里推荐用OmicShare Tools。

高级气泡图:
https://www.omicshare.com/tools/Home/Soft/seniorbubble

动态富集气泡图:

https://www.omicshare.com/tools/ ... _enrich_bubble.html

富集圈图

富集圈图是基迪奥原创的富集分析图形,它在被推出半年后就在高分期刊Theranostics(IF = 8.579)中的单细胞转录组文章中出现(如下图6所示)。GO富集结果表明在Vsir-/-突变小鼠牛皮癣疾病进展中,巨噬细胞主要发挥促进蛋白折叠(protein folding)、神经元死亡的负调控(negative regulation of neuron death)、神经元凋亡的调节(regulation of neuron apoptotic)、神经元凋亡过程(neuron apoptotic process)等作用。

图6 Theranostics文章原图(对Vsir-/-和WT巨噬细胞的上调路径进行GO富集分析)

富集圈图放在SCI文章中既炫酷也可以展示更多的数据信息,如下图7所示,该图形共有4圈:

第一圈为富集的分类,如GO富集分析可以展示3大类,KEGG富集分析可以展示7大类,圈外为基因数目的坐标尺,不同的颜色代表不同的分类;

第二圈:背景基因中该分类的数目以及Q值或P值。基因越多条形越长,值越小颜色越红;

第三圈:上下调基因比例条形图,红色代表上调基因数目,绿色代表下调基因数目;方框中显示具体的数值;当输入的差异基因数量只有一列(未区分上下调)时,第三圈显示前景基因的总数目;

第四圈:各分类的RichFactor值(该分类中前景基因数量除以背景基因数量),背景辅助线每个小格表示0.1。可应用于GO/KEGG富集分析的结果展示。

图7 GO富集圈图

从上图对该图形的解读中可知,圈图的应用范围也较为广阔,一般可以呈现GO富集分析或KEGG富集分析结果。

图形绘制:

富集圈图:
https://www.omicshare.com/tools/Home/Soft/enrich_circle

动态富集圈图:

https://www.omicshare.com/tools/ ... _enrich_circle.html

z-score气泡图、KEGG富集分析网络图见下篇)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2020.12.9
在线时间
10 小时

发表于 2020.12.12 08:54:20 | 显示全部楼层
创新性很强
回复 支持 反对

使用道具 举报

功夫熊猫

Rank: 10Rank: 10Rank: 10

主题
0
注册时间
2020.11.21
在线时间
97 小时

发表于 2020.12.15 10:14:39 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2018.9.18
在线时间
14 小时

发表于 2020.12.16 19:27:11 | 显示全部楼层
又是忙碌的一天
回复

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2021.6.26
在线时间
7 小时

发表于 2021.7.2 19:56:34 | 显示全部楼层
受益匪浅
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2019.5.22
在线时间
11 小时

发表于 2021.9.18 21:36:08 | 显示全部楼层
真的很nice 同时我想请教一下咱们这个网站GO富集以及KEGG分析这块是否可以进行多基因联合分析?
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
626
注册时间
2020.6.16
在线时间
372 小时

 楼主| 发表于 2021.9.22 14:35:00 | 显示全部楼层
D13223766303 发表于 2021.9.18 21:36
真的很nice 同时我想请教一下咱们这个网站GO富集以及KEGG分析这块是否可以进行多基因联合分析? ...

不行
新的一天加油!
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2021.9.28
在线时间
0 小时

发表于 2021.9.28 17:51:32 | 显示全部楼层
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2021.8.19
在线时间
2 小时

发表于 2021.9.30 15:32:57 | 显示全部楼层
学习了,正好用得上
新的一天加油!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表