细菌抗性基因(CARD)注释


*
选择文件 示例文件
*VIP专属优惠,注释工具7折
*当前账户剩余0次

功能介绍:

CARD(Comprehensive Antibiotic Resistance Database)数据库是加拿大的一个生信团队在2013年发布的抗性基因数据库,它包含了ARDB数据库中所有的抗性信息,同时还每月更新,保证数据有效性。

CARD以Antibiotic Resistance Ontology (ARO)为分类单位的形式所构建,其中ARO是数据库所构建term,用于关联抗生素模块及其目标、抗性机制、基因变异等信息。同时,数据库还针对ARO的功能,专门开发了一款名为Resistance Gene Identifier (RGI)的软件程序, 用于基因组数据的抗性基因预测。

输入文件:

输入fasta格式的核酸或蛋白query序列文件

输出结果:

1. 序列注释结果总表

包含E value、 Score值、 描述信息的注释结果表。

2.比对结果统计饼图

将比对上的与比对不上的序列数目进行统计并画饼图。

3. 比对结果E值分布图

结果范例:

1. 序列注释结果总表

ORF_ID

CONTIG

STAR

STOP

Strand

CUT_OFF

PASS_EVALUE

Best_Hit_evalue

Best_Hit_ARO

Best_Identities

ARO

ARO_name

Model_type

SNP

Best_Hit_ARO_category

ARO_category

#结果表格说明

·  ORF_ID:所输入ORFID

·  CONTIG:ORF所在contig

·  START:ORF起始位点

·  STOP:ORF终止位点

·  Strand: 正负链

·  CUT_OFF:RGI的筛选方法,有PerfectStrict、和Loose三种

·  PASS_EVALUE:过滤阈值,通过此阈值的所有ARO结果都被保留

·  Best_Hit_evalue:最佳ARO预测结果的e

·  Best_Hit_ARO:最佳注释结果

·  Best_Identities::ORF与最佳注释结果的序列相似度

·  ARO:通过过滤阈值的所有AROID

·  ARO_name:通过过滤阈值的所有ARO注释

·  Model_type:RGI预测类型,分为protein variantprotein homolog两种

·  SNP:ORF相比注释结果所对应的蛋白变异位点

·  Best_Hit_ARO_category:最佳注释ARO所属抗性基因分类

·  ARO_category:所有通过阈值的ARO所属抗性基因分类


2.比对结果统计饼图

将比对上的与比对不上的序列数目进行统计并画饼图。

表1.     CARD比对结果数目统计表

Total sequence number

Annotation sequences

Without annotation sequences


3. E值分布

E值是指期望数据库中具有某一统计学意义配对序列的值,可理解为比对的假阳性率。E值越小,结果越可靠。对E值分为5个范围进行统计,并画饼图。


Q1. 上传的数据需要保存成什么格式?文件名称和拓展名有没有要求?

 

OmicShare当前支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。如果是核酸、蛋白序列文件,必须为FASTA格式(本质是文本文件)。

 

文件名可由英文和数字构成,文件拓展名没有限制,可以是“.txt”、“.xlsx”、“.xls”、“.csv”“.fasta”等,例如 mydata01.txt,gene02.xlsx 。

 

Q2.注释工具的任务一般要跑多久?

注释工具的任务时长一般与提交的序列条数成正比,且不同工具耗时也差异很大。例如GO功能注释近一年来所有任务平均时长约为2天,而NR注释工具近一年来所有任务平均时长约为3小时。一般情况下,如果任务耗时超出一周可联系OS客服,发送任务编号给OmicShare客服,会有专人为你处理任务问题。