Pathway富集分析





1:

选择文件 格式示例



即想要研究的基因列表,每行第一列为基因id,要包含在背景基因表中.
选择文件 格式示例
即所有基因的列表,第一列为基因id,第二列为用于获取pathway的一个id,有3种类型kegid、ncbi-geneid、KO号(具体可以点击案例演示查看)


3:
* 注意此类型选择要与上一项基因表对应

4:
*

添加基因差异表达差异倍数  

  任务完成后发邮件通知我

 使用一次消耗奥币数 5



Pathway富集分析工具的使用与解读详细教程

功能:
在生物体内,不同基因相互协调行使其生物学功能,基于Pathway的分析有助于更进一步了解基因的生物学功能。KEGG是有关Pathway的主要公共数据库。 Pathway显著性富集分析以KEGG Pathway为单位,应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway。
P的计算公式生物云平台 其中,N为所有基因(背景基因)的数量,n为差异基因(目的基因)的数量,M为所有基因中该pathway的数量,i为差异基因中注释到该pathway的数量,计算得到的pvalue通过Bonferroni校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的pathway定义为在差异表达基因中显著富集的pathway。


输入:

①输入的表格文件,必须为txt格式。可以选择在excel中将数据打开,然后另存为"文本文件(制表符分隔)(*.txt)"。

②富集的目的基因列表,即想要研究的基因列表,每行第一列为基因id,要包含在背景基因表中.

③背景基因总表,即所有基因的列表,第一列为基因id,第二列为用于获取pathway的一个id,有3种类型:
   类型1:kegid,例如mmu:18053,即KEGG官网上的id,可以通过KEGG注释或者KEGG官网获得。
   类型2:ncbi-geneid,例如18053,即ncbi上得到的geneid,一连串数字组成。
   类型3:KO号,例如K10942,不同物种间相同KO号会有对应不同的pathway的情况,详情可以查看KEGG官网,直接通过KO号获取pathway会不准确。建议通过前两种类型来获取。

④基因差异表达差异倍数表:第一列为基因ID,第二列为差异表达倍数log2(FC)。


参数:

①背景基因表类型有3种,分别为:KO,ncbi-geneid、KEGGid。

②数据库:当背景基因表类型为keggid和ncbi-geneid时,选择相应物种库和全库都可以,但选择相应物种库能缩短运行时间;当背景基因表类型为KO类型时,建议选择相应物种库进行注释。

③可选参数:添加基因差异表达差异倍数表。


输出:

①out.path.xls : 目的基因相对于背景基因的富集统计表。

②out_map: 目的基因在各个pathway map的结果图。

③out.path.png,out.path.svg:各个pathway的B级分类的统计图。

④out.htm: 网页格式结果。

示例文件:富集的目的基因列表文件   背景基因表文件    基因差异表达差异倍数表

生物云平台

网页格式结果 分两个部分,上面为pathway的富集信息(图1),包括pathway名,基因数,背景基因数,P值,Q值,pathwayID,下面为每个pathway具体的基因(图2),点击pathway名可以查看基因在pathway的信息(图3):

图1: the page layout of out.html 生物云平台

图2: kegg map of out_map 生物云平台

图3:pathway classification of out.path.png 生物云平台