eggNOG注释


*
选择文件 示例文件
*VIP专属优惠,注释工具7折
*当前账户剩余0次
功能介绍:


eggNOG 数据库(evolutionary genealogy of genes: Non-supervised Orthologous Groups)是利用 Smith-Waterman 比对算法对构建的基因直系同源簇 (Orthologous Groups) 进行功能注释, eggNOG(v4.5)目前涵盖了2031个物种,覆盖了1,678种细菌,115种古细菌,238种真核物种以及352种病毒。构建了包含25个大类,约19万个直系同源簇。

利用DIAMOND比对软件将目标序列比对到eggNOG数据库。DIAMOND通过寻找两条序列之间的局部相似性,得到跟目标序列具有最高序列相似性的蛋白,从而推断序列的蛋白功能与进化关系。


输入:

输入fasta格式的核酸或蛋白query序列,或上传fasta格式的query序列文件.



输出结果:

1. 序列注释结果总表

包含E value、 Score值、 描述信息的注释结果表。表格可通过不同阈值筛选结果。



2.比对结果统计饼图

将比对上的与比对不上的序列数目进行统计并画饼图。









1. 序列注释结果总表

表头解释:

Query_id                           基因序列的ID号

Query_length      基因序列的长度

Query_start 比对上的部分在 query序列上的起始位置

Query_end 比对上的部分在query序列上的终止位置

Subject_id 比对到 eggNOG数据库中序列名

Subject_length  eggNOG序列的长度

Subject_start 比对上的部分在 eggNOG 序列上的起始位置

Subject_end 比对上的部分在 eggNOG 序列上的终止位置

Identity(%) 比对的相似性(百分比)

Gap                                       Gap 的数目

Align_length   比对上的长度

Score   比对的打分(打分越高,可信度越高)

E_value     比对的 E值(E值越小,可信度越高)

Subject_annotation  eggNOG的注释信息

NOGid  eggNOG中的ID

description   eggNOG中的描述信息

Class  eggNOG的分类


2.比对结果统计饼图

将比对上的与比对不上的序列数目进行统计并画饼图。

表1.     eggNOG比对结果数目统计表

Total sequence number

Annotation sequences

Without annotation sequences


3. eggNOG分类统计柱状图

对eggNOG的分类进行统计,并绘制柱状图

表2. eggNOG 分类表

Code

Functional-Categories

Gene-Number

Genes

A

RNA processing and modification

46

Unigene0003846,COG5180 Unigene0004454,COG5147 ...

B

Chromatin structure and dynamics

99

Unigene0003587,COG2036 Unigene0003593,COG0123 ...

C

Energy production and conversion

331

Unigene0003680,COG1819 Unigene0003731,COG1053 ...

表头解释

Code      eggNOG 功能代号

Functional-Categories       eggNOG功能分类

Gene-Number     基因在各 eggNOG功能分类的数量

Genes    Unigene 在各eggNOG功能分类的序列ID





eggNOG功能分类图


4. 比对结果E值分布

E值是指期望数据库中具有某一统计学意义配对序列的值,可理解为比对的假阳性率。E值越小,结果越可靠。对E值分为5个范围进行统计,并画饼图。



Q1. 上传的数据需要保存成什么格式?文件名称和拓展名有没有要求?

 

OmicShare当前支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。如果是核酸、蛋白序列文件,必须为FASTA格式(本质是文本文件)。

 

文件名可由英文和数字构成,文件拓展名没有限制,可以是“.txt”、“.xlsx”、“.xls”、“.csv”“.fasta”等,例如 mydata01.txt,gene02.xlsx 。

 

Q2.注释工具的任务一般要跑多久?

注释工具的任务时长一般与提交的序列条数成正比,且不同工具耗时也差异很大。例如GO功能注释近一年来所有任务平均时长约为2天,而NR注释工具近一年来所有任务平均时长约为3小时。一般情况下,如果任务耗时超出一周可联系OS客服,发送任务编号给OmicShare客服,会有专人为你处理任务问题。