1. 功能:帮助用户解决常见研究物种的基因ID在不同数据库之间的ID转换,并且提供基因的常见注释信息,为用户研究基因提供方便。
2. 适用物种:拟南芥(Arabidopsis thaliana)、牛(Bos taurus)、山羊(Capra hircus)、秀丽线虫(Caenorhabditis elegans)、果蝇(Drosophila melanogaster)、斑马鱼(danio rerio)、鸡(gallus gallus)、人(homo sapiens)、猕猴(Macaca mulatta)、小鼠(mus musculus)、籼稻(oryza indica)、水稻(oryza sativa)、大鼠(rattus norvegicus)、酵母(Saccharomyces cerevisiae)、番茄(Solanum lycopersicum)、猪(Sus scrofa)、小麦(Triticum aestivum)、玉米(Zea mays)
3. 输入文件:
一行一个基因ID,文件格式支持txt/csv/xls/xlsx格式
如:
A1BG |
NAT1 |
SERPINA3 |
…… |
4. 参数选项:
物种选择:选择输入ID的物种类型
输入ID类型:选择要转换的ID类型,默认可读取4种类型之一,分别是 Gene_stable_ID (Ensembl gene ID) / Gene_name (Gene Symbol) / NCBI_gene_ID (NCBI Entrez Gene ID) / Gene_Synonym
注:4种ID类型的示例文件可点击输入文件旁边的“示例文件”查看
输入文件是否有列名:是/否
输出ID类型:可选择输出多种ID类型,或者选择输出多种数据库的基因功能注释信息,帮助您快速了解该基因功能信息。
5. 输出文件:
xls格式
示例文件:
参数设置:
输出文件:
第一列:用户输入的ID,symbol 号
第二列:小鼠的ensembl ID
第三列:NCBI ID号,通常是数值
第四列:基因同义名
第五列:基因的注释信息,如基因功能,表达某蛋白
第六列:KEGG A分类,一般有7大类
第七列:KEGG B分类,比A分类的信息更详细
第八列:通路ID,即ko号,还有通路详细名称,如TGFβ信号通路
第九列:K号,可用与KEGG富集分析
第十列:GO注释细胞组分
第十一列:GO注释分子功能
第十二列:GO注释生物学途径
Q1. 为什么输出没有结果,如下图?
没有输出结果可能原因:
①物种选错了;
②上传的文件中,基因ID类型跟参数选择不对应。
Q2. 为什么输出结果,数目比我提交时多?
比如 一个NCBI_gene_ID可能对应多个Gene Synonym(如:3804对应Gene Synonym有CD158B2、p58、NKAT2),工具会把所有结果输出。
Q3:为什么有部分基因没有结果?
如果有部分基因没有数据,有可能是该基因类型选错了。
比如下图中"CD89""103AS"类型是Gene_Synonym,在分析时选了”Gene_name“则比对不上,无结果了。
Q4. 提交时报错常见问题:
1.提交时显示X行X列空行/无数据,请先自查表格中是否存在空格或空行,需要删掉。
2.提交时显示列数只有1列,但表格数据不止1列:列间需要用分隔符隔开,先行检查文件是否用了分隔符。
其它提示报错,请先自行根据提示修改;如果仍然无法提交,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。
Q3. 提交的任务完成后却不出图该怎么办?
主要原因是上传的数据文件存在特殊符号所致。可参考以下建议逐一排查出错原因:
(1)数据中含中文字符,把中文改成英文;
(2) 数据中含特殊符号,例如 %、NA、+、-、()、空格、科学计数、罗马字母等,去掉特殊符号,将空值用数字“0”替换;
(3)检查数据中是否有空列、空行、重复的行、重复的列,特别是行名(一般为gene id)、列名(一般为样本名)出现重复值,如果有删掉。
排查完之后,重新上传数据、提交任务。如果仍然不出图,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。