Reactome富集分析


1: *
*
2: *
*ProVIP免费
*VIP免费
*当前账户剩余0次

了解该工具的原理与详细解析,请点击>>

 

介绍

Reactome是开源的关系数据库,它记录了信号和代谢分子及其组成生物途径和过程的关系。Reactome数据模型的核心单元是反应 (reaction)。参与反应的物质(核酸、蛋白质、复合物、小分子等)形成了生物相互作用的网络,并被归类为途径(pathway)。Reactome中的生物途径包括代谢、信号转导、转录调控、凋亡和疾病。Reactome的通路都是由专家撰写,经同行评阅的有关人体内各项反应及生物学路径的文章的数据库,目前在医学、遗传学、基因组学、分子生物学等领域的研究人员用于解释高通量实验研究的结果。Pathway显著性富集分析以Reactome Pathway为单位,应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway。

P的计算公式:

其中,N为所有基因(背景基因)的数量,n为差异基因(目的基因)的数量,M为所有基因中该pathway的数量,i为差异基因中注释到该pathway的数量,计算得到的pvalue通过FDR校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的pathway定义为在差异表达基因中显著富集的pathway。

 

功能:

输入基因集或差异表达倍数的基因集,通过预设定参数,进行Reactome富集分析并将分析结果进行精美图形可视化,输出图形有富集气泡图、富集条形图、富集圈图、z-score气泡图(输出图形可选)。

 

适用范围:

可对15个常见物种的基因集进行富集分析,牛、斑马鱼、人、小鼠、大鼠、猪、秀丽线虫、果蝇、拟南芥、水稻、番茄、小麦、酵母、鸡、籼稻,并且提供2个基因组版本;

也可以自行准备研究物种的背景基因进行富集分析。

 

输入:

① 输入的表格文件,支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。

② 富集的目的基因列表,即想要研究的基因列表,每行第一列为基因id,要包含在背景基因表中。请查看示例文件格式或下表。

 

ENSG00000151474

ENSG00000182175

ENSG00000153071

ENSG00000183117

 

③ 选择使用已有参考或者输入自己注释(整理)的DO信息作为背景基因。

选择已有参考时,注意版本号

输入自己整理的Reactome数据时,可以在背景基因表输入即可,但也要注意格式,如下表:

ENSG00000186092

R-HSA-162582,R-HSA-372790

ENSG00000187642

R-HSA-1592230

ENSG00000162576

R-HSA-381426,R-HSA-392499

 

④基因差异表达差异倍数表:第一列为基因ID,第二列为差异表达倍数log2(FC)。

 

参数:

① 可选参数:添加基因差异表达差异倍数表。(提示:如果不输入差异表达倍数表,则不会输出富集差异z-score气泡图

② 选择P值或Q值作图:P-value/Q-value

③ 选择前多少个通路作图:15/20/25/30

④ 选择想要绘制的图形:富集气泡图/富集条形图/富集圈图/z-score气泡图

 

输出:

① out.barplot/gradient.png/pdf:前20个显著富集条形图和气泡图(png/pdf格式)(n表示选择前多少个通路作图的数量)

② out.bubble.png/pdf:前20个显著富集z-score气泡图(png/pdf格式)(如果通路太多,则影响图形美观和整体布局,所以该图形默认使用前20个通路绘图)

③ out.circular.png/svg:前15/20个显著富集圈图(png/svg格式)(最多展示20个通路,如果选择30或25个通路,则输出结果还是20个通路)

④ out.bar_Gradient.xls:绘制富集圈图文件,可用该文件在动态富集圈图工具进行个性化修改。

⑤ out.reactome.xls : 目的基因相对于背景基因的富集统计表。

⑥ out.do.html:网页格式结果。

 

示例文件:

               富集的目标基因列表

               背景基因列表

               差异基因倍数列表

 

输入:

富集分析步骤:

第1步:上传目的基因文件;

第2步:选择(或上传)背景基因文件;

第3步:提交。

 

 

 

输出:

 

out.circular.png/svg:前20个显著富集差异通路圈图

 

 

② out.bubble.png/pdf:前20个显著富集差异通路的z-score气泡图

 

 

③ out.barplot/gradient.png/pdf:前20个显著富集通路的条形图和气泡图

 

 

 

④ out.reactome.html:网页格式结果分两个部分,上面为DOID的富集信息(图1),包括DOID,DO名称,富集到的基因数,背景基因数,P值,Q值;下面为每个DODI具体的基因(图2),点击DODI可以查看基因在DO的信息,并且点击图2 的DODI号可以到DO数据库网页查看更详细的信息(图3)。

 

                                                                                                                                                                                     图1

 

                                                                                                                                                                                      图2

 

                                                                                                                                                                                      图3

 

Q1. 上传的数据需要保存成什么格式?文件名称和拓展名有没有要求?

 

OmicShare当前支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。如果是核酸、蛋白序列文件,必须为FASTA格式(本质是文本文件)。

 

文件名可由英文和数字构成,文件拓展名没有限制,可以是“.txt”、“.xlsx”、“.xls”、“.csv”“.fasta”等,例如 mydata01.txt,gene02.xlsx 。

 

Q2. 提交时报错常见问题:

 

1.提交时显示X行X列空行/无数据,请先自查表格中是否存在空格或空行,需要删掉。

2.提交时显示列数只有1列,但表格数据不止1列:列间需要用分隔符隔开,先行检查文件是否用了分隔符。

其它提示报错,请先自行根据提示修改;如果仍然无法提交,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。

 

Q3. 提交的任务完成后却不出图该怎么办?

 

主要原因是上传的数据文件存在特殊符号所致。可参考以下建议逐一排查出错原因:
(1)数据中含中文字符,把中文改成英文;
(2) 数据中含特殊符号,例如 %、NA、+、-、()、空格、科学计数、罗马字母等,去掉特殊符号,将空值用数字“0”替换;
(3)检查数据中是否有空列、空行、重复的行、重复的列,特别是行名(一般为gene id)、列名(一般为样本名)出现重复值,如果有删掉。
排查完之后,重新上传数据、提交任务。如果仍然不出图,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。

 

Q4.下载的结果文件用什么软件打开?

 

OmicShare云平台的结果文件(例如,下图为KEGG富集分析的结果文件)包括两种类型:图片文件和文本文件。

图片文件:

为了便于用户对图片进行后期编辑,OmicShare同时提供位图(png)和矢量图(pdf、svg)两种类型的图片。对于矢量图,最常见的是pdf和svg格式,常用Ai(Adobe illustrator)等进行编辑。其中,svg格式的图片可用网页浏览器打开,也可直接在word、ppt中使用。

 

文本文件:

文本文件的拓展名主要有4种类型:“.os”、“.xls”、“.log”和“.txt”。这些文件本质上都是制表符分隔的文本文件,使用记事本、Notepad++、EditPlus、Excel等文本编辑器直接打开即可。结果文件中,拓展名为“.os”文件为上传的原始数据;“.xls”文件一般为分析生成的数据表格;“.log”文件为任务运行日志文件,便于检查任务出错原因。

 

Q5. 提交的任务一直在排队怎么办?

 

提交任务后都需要排队,1分钟后,点击“任务状态刷新”按钮即可。除了可能需运行数天的注释工具,一般工具数十秒即可出结果,如果超出30分钟仍无结果,请联系OS客服,发送任务编号给OmicShare客服,会有专人为你处理任务问题。

 

Q6. 结果页面窗口有问题,图表加载不出来怎么办?

尝试用谷歌浏览器登录OmicShare查看结果文件,部分浏览器可能不兼容。