查看: 3987|回复: 52

GO、KEGG富集分析如何显示上下调基因?

  [复制链接]

迅猛龙

Rank: 8Rank: 8

主题
257
注册时间
2020.6.16
在线时间
165 小时

发表于 2021.4.12 09:37:58 | 显示全部楼层 |阅读模式
本帖最后由 基迪奥-Jt桃 于 2021.4.12 09:37 编辑

最近,在基迪奥生信交流QQ群(生信交流3群群号:492506813)有这样一个问题引起了我的注意:在做GO、KEGG富集分析时,如何将上下调基因体现在分析结果中?


其实,上图中的GO分类柱状图是由OmicShare的GO富集分析工具绘制的。OmicShare非常受欢迎,引用SCI文章近1200篇。下面就为大家详细介绍如何在富集分析时添加差异信息。

本文的示例工具为OmicShare最新推出的GO、KEGG富集分析高级版,而其他富集分析工具(如DO富集分析,动态GO、KEGG富集分析)用法几乎完全相同。

工具链接:
https://www.omicshare.com/tools/

GO富集分析

1.使用工具自带的背景基因文件

数据准备

如果你的数据源于常见的模式物种,比如人、水稻、拟南芥、小鼠、大鼠、斑马鱼、鸡、秀丽线虫和果蝇,那么可以直接选择工具内建的背景基因文件,你只需要准备一个感兴趣的目的基因ID列表即可,比如,常见的差异基因集。

如果你想在富集分析结果中显示上下调基因,那么目的基因文件必须包含两列,第1列为基因id,第2列为log2FC值(差异倍数取对数)。


注意,如果使用工具自带的背景文件,那么目的基因文件的基因ID类型(第1列)需要使用BioMart等工具转换为Ensembl ID,如果是自己准备的背景基因文件则无此限制,只需目的基因id与背景基因id一致即可。

Ensembl id的结构是“物种前缀序列类型数字”。在 Ensembl ID 后面的”小数”部分为版本号,如这里的ENSG00000121410.11,注意,千万记得不要用带有版本号的Ensembl ID去做在线的富集分析!

常见的物种前缀:
“ENS”表示Homo sapiens (Human),“ENSMUS”表示Mus musculus (Mouse),“ENSDAR”表示Danio rerio (Zebrafish);而常见的序列类型用G、P、T分别表示gene、protein和transcript。关于gene id的分类和相互转换请参考《常用数据库基因ID格式整理》和《推荐一款好用的基因ID转换工具》这两篇文章(见工具书Ⅲ)。

最后,把Excel中整理好的文件另存为“制表符分隔的”txt文件,如下图,OmicShare和几乎所有的生信在线工具一样目前不支持Excel格式。另外,数据中不要出现中文、空格、特殊符号比如()、?、*、[ ]、$ 等。

参数选择

目的基因文件准备好后,点选择文件按钮,上传数据,是否包含log2FC列这里选“包含”,接着勾选“使用自带背景基因文件”,然后选择对应的物种(这里是人),gene id类型、Ensembl数据库版本保持默认,最后点提交按钮。


分析结果

数十秒后,在我的项目页面刷新任务状态,任务完成后,点击下载按钮将分析结果下载到本地。


解压缩结果文件后,可查看富集分析结果,如下。


另外,目的基因文件的第2列(log2FC)为富集分析提供上下调基因的信息,如果分析结果中不展示上下调基因,那么,这一列可去掉,如下,或者选“不包含”log2FC列,分析时忽略第2列的数据。


2.使用自己准备的背景文件

数据准备

对于工具中没有提供背景基因文件的物种,这时需要自己使用结题报告的基因注释文件制作背景文件,所用工具是Excel。以基迪奥的转录组结题报告为例,可通过下图所示的文件夹找到所需的基因注释总表。


然后,在Excel中将其他的列删掉,只保留以下4列(gene id和GO注释列,如下图),然后另存为“制表符分隔的”txt文件,这样,背景文件就做好了!


至于目的基因文件的准备,gene id不要求是Ensembl ID,可以是自定义的gene ID(各大数据库没有的),只要和背景基因id一致即可。同样,如果想展示上下调基因,目的基因文件保留2列,我这里使用结题报告中的A、B两个组的差异基因集,如下。


注意,自己准备的目的基因列表一定是背景基因总表的“子集”,很多用户分析没结果的原因是一些目的基因在背景基因列表中找不到!这时你可用OmicShare的表格筛选工具、韦恩图工具等检查一下。

参数选择

选择文件按钮,分别上传刚才准备好的目的基因和背景基因文件(制表符分隔的txt文件),是否包含log2FC列选“包含”,点提交按钮。


分析结果

同样,下载分析结果,解压后得到富集分析结果,包括富集分析统计表格、作图数据、以及样式丰富的图表。比如,除了直接生成显示上下调基因的GO二级分类柱状图,如下图,也包括传统的富集分析条形图、气泡图、有向无环图等。


还生成最新推出的差异富集气泡图,如下。在组合图表中,气泡图的横轴为上下调标准化系数(up-down normalization),纵轴为﹣log10Pvalue,不同的颜色则表示不同的功能分类,橙色阈值线为Pvalue=0.05;而右侧的表格为Pvalue值最小的20个GO term。通过这个图表可以直观展示不同功能分类中显著富集的功能。


Tips
up-down normalization=(上调差异基因数-下调差异基因数)/(上调差异基因数+下调差异基因数)

此外,还有非常受欢迎的富集圈图(含上下调基因信息),如下图。


关于富集圈图,由外向内,第1圈为GO id(或pathway id)标签,第2圈的条形长度对应背景基因数,颜色的深浅对应显著程度,即Pvalue(或Qvalue);第3圈对应目的基因数,可以只展示总目的基因数,也可展示目的基因中上下调基因的比例;第4圈(极坐标柱状图)为富集因子(Rich factor),以GO富集分析的结果为例,由fg_num(即Up+Down)和bg_num相除所得,对应“out.bar_Gradient.xls”文件中ratio列的数据。

KEGG富集分析

1.使用工具自带的背景基因文件

数据准备、参数的设置方法与GO富集分析相同,这里不再赘述。


2.使用自己准备的背景文件

数据准备

仍以基迪奥的转录组结题报告为例,准备方法同上文GO背景文件,在Excel中将其他的列删掉,只保留以下2列,gene id和KO id(K number),如下图,然后另存为“制表符分隔的”txt文件,这样,背景文件就做好了!


目的基因文件仍使用上文GO富集分析的文件。


参数选择

选择文件按钮,分别上传刚才准备好的目的基因和背景基因文件(制表符分隔的txt文件),我的目的基因文件包含差异信息,因此,是否包含log2FC列选“包含”;背景基因类型我这里选KO,如果你制作的背景基因文件的第2列是NCBI的gene id,则需要选ncbi-id;物种我这里选植物(避免富集到人类相关的通路),然后点提交按钮。


分析结果

数十秒后,刷新任务,与GO富集分析不同的是,除了下载分析结果之外,我们还可以点击预览按钮,查看kegg pathway 网络图。


在网络图编辑窗口中,我们可以对网络图的结点、边进行个性化调整,如下图,满意后可下载为svg或png格式的图片。


对于KEGG富集分析的结果,与GO富集分析类似,也包括气泡图、条形图、富集圈图等,比如,富集圈图中也包含上下调基因信息。


除此之外,差异基因信息也会在KEGG富集分析的pathway map上体现,如下图,红色表示上调,绿色表示下调。


好啦,关于GO、KEGG富集分析如何显示上下调基因,你学会了吗?

本文作者:基迪奥-莫北     

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
0
注册时间
2020.2.12
在线时间
51 小时

发表于 2021.4.12 10:55:53 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.4.12 11:03:03 | 显示全部楼层
加油,加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2021.3.29
在线时间
4 小时

发表于 2021.4.12 19:53:48 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.4.13 08:06:39 | 显示全部楼层
加油,加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
0
注册时间
2020.11.21
在线时间
42 小时

发表于 2021.4.13 10:45:51 | 显示全部楼层
坚持就是胜利!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.4.14 08:29:53 | 显示全部楼层
加油,加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2020.11.23
在线时间
9 小时

发表于 2021.4.14 16:13:00 | 显示全部楼层
有所帮助
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.4.15 08:19:53 | 显示全部楼层
加油,加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2021.3.29
在线时间
4 小时

发表于 2021.4.15 16:53:17 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2021.3.11
在线时间
1 小时

发表于 2021.4.15 20:45:13 | 显示全部楼层
这些图都太漂亮了~
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2021.1.28
在线时间
7 小时

发表于 2021.4.15 22:34:40 | 显示全部楼层
打卡!!!!!!!!!!!!!
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2021.4.16
在线时间
1 小时

发表于 2021.4.19 16:12:48 | 显示全部楼层
学习学习
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.5.12 09:57:21 | 显示全部楼层
加油,加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.5.13 08:14:33 | 显示全部楼层
加油,加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
注册时间
2017.4.8
在线时间
20 小时

发表于 2021.5.13 10:06:12 | 显示全部楼层
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
1
注册时间
2016.8.25
在线时间
65 小时

发表于 2021.5.13 18:49:47 | 显示全部楼层
学习了,再次感谢
忘记签到了
回复 支持 反对

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
0
注册时间
2020.11.21
在线时间
42 小时

发表于 2021.5.13 20:13:27 | 显示全部楼层
坚持就是胜利!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2017.9.8
在线时间
40 小时

发表于 2021.5.14 08:08:18 | 显示全部楼层
加油,加油!
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
0
注册时间
2020.2.12
在线时间
51 小时

发表于 2021.5.14 08:37:10 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表