GO富集分析





即想要研究的基因列表,每行第一列为基因id,基因id要包含在背景基因表中






目前提供的物种有水稻、拟南芥、小鼠、大鼠、斑马鱼、鸡、秀丽线虫、果蝇、人。ID类型可选择基因ID或转录本ID,根据富集目的基因的ID类型决定。可以点击“使用已有参考选项”后出现的“预览参考文件”来查看具体ID。
所有基因的GO注释文件,格式为第一列为基因id,第二类为GO注释结果
  任务完成后发邮件通知我

 使用一次消耗奥币数 5



GO富集分析详解教程

功能:
Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表(controlled vocabulary)来全面描述生物体中基因和基因产物的属性。GO总共有三个ontology(本体),分别描述基因的分子功能(molecular function)、细胞组分(cellular component)、参与的生物过程(biological process)。GO的基本单位是term(词条、节点),每个term都对应一个属性。GO功能分析一方面给出差异表达基因的GO功能分类注释;另一方面给出差异表达基因的GO功能显著性富集分析。 首先,我们将差异表达基因向GO数据库(http://www.geneontology.org/)的各term映射,并计算每个term的基因数,从而得到具有某个GO功能的基因列表及基因数目统计。然后应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著富集的GO条目。
P的计算公式: 生物云平台 其中,N为所有Unigene中具有GO注释的基因数目;n为N中差异表达基因的数目;M为所有Unigene中注释为某特定GO term的基因数目;m为注释为某特定GO term的差异表达基因数目。计算得到的pvalue通过FDR校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的GO term定义为在差异表达基因中显著富集的GO term。通过GO功能显著性富集分析能确定差异表达基因行使的主要生物学功能。


输入:

①输入的表格文件,必须为txt格式。可以选择在excel中将数据打开,然后另存为"文本文件(制表符分隔)(*.txt)"。

②富集的目的基因列表,即想要研究的基因列表,每行第一列为基因id,基因id要包含在背景基因表中。

③背景基因总表,如果是有参考基因组的模式生物,可以直接使用已有参考基因作为背景基因文件。目前提供的物种有水稻、拟南芥、小鼠、大鼠、斑马鱼、鸡、秀丽线虫、果蝇、人。ID类型可选择基因ID或转录本ID,根据富集目的基因的ID类型决定。可以点击“预览参考文件”来查看具体ID。
如果所研究物种不在以上范围,则需要自行准备GO背景基因文件。现在支持两种格式。第一种:格式为第一列为基因id,第二列为GO注释结果。第二种:同一个基因的所有GO号会在同一行并列给出。任务提交后,程序会自动判断处理。如下图所示:

生物云平台 生物云平台



输出:

①out.[PFC].html: 网页格式结果,3个分别对应GO的3个主要分类。

②out.[PFC].xls: 基因的GO功能分类统计结果。

③out.[PFC].png:基因的GO功能分类结果统计图

④out.secLevel2.svg/png:为GO二级分类统计图,统计了用于富集的基因在GO 的二级分类中占各个分类的数量,统计结果在xls表中。表格内容包括,Ontology,Class(GO的二级分类),基因数,具体基因id。

⑤out.level2.xls: GO第二级分类统计

示例文件:GO富集目的基因列表文件   描述信息文件
生物云平台
输出结果:

① out.[PFC].html 网页格式结果,3个分别对应GO的3个主要分类。结果如下图所示, 包含两个部分: 第一部分为GO富集结果统计表,包括GOid,GO功能描述,基因比例,背景基因比例,P值,Q值,P值Q值 小于0.05的显示红色。
生物云平台
② 第二部分为GO富集的具体基因,点击GOid可以链接到http://amigo.geneontology.org 官网,可以查看GO的具体信息。
生物云平台

③ out.[PFC].png,out.[PFC].pdf,out.[PFC].xls GO富集的有向无环图,只显示富集的GO term(即p值小于0.05的),没有小于 0.05的结果时,则没有这些文件。可以在xls结果从查看,结果与网页结果对应,包括GOid,GO功能描述,基因比例,背景基因比例,P值,Q值,以及相应的基因id.


④ out.secLevel.svg/png 图片结果如下图所示,为GO二级分类统计图,统计了用于富集的基因在GO 的二级分类中占各个分类的数量,统计结果在xls表中。表格内容包括,Ontology,Class(GO的二级分类),基因数,具体基因id.生物云平台 生物云平台