迅猛龙
 
- 主题
- 183
- 注册时间
- 2020.6.16
- 在线时间
- 107 小时
|
本帖最后由 基迪奥-Jt桃 于 2021.2.4 09:06 编辑
Softberry开发了数百个免费的基因分析工具,有很多工具比较受欢迎,比如有些小伙伴可能知道的真核基因预测小工具FGENESH、细菌启动子预测工具BPROM等。通过谷歌学术搜索“fgenesh”发现目前引用量在4300左右,而BPROM的引用量在2200左右。
网站链接:
http://www.softberry.com/berry.phtml
下面主要为大家分享FGENESH(基于HMM)的使用方法,在首页点击Run Programs Online/Gene Finding in Eukaryota,第一个工具即是我们所需的。工具的界面很简单,主要包括一个核酸序列输入框、一个用于上传序列文件的“选择文件”按钮,以及用于提交任务的“search”按钮,如下。
下面,我以具体的DNA序列为例,为大家演示如何使用FGENESH查找、预测基因。为了方便大家练习使用,本文所用到的范例序列文件已上传到OmicShare 论坛上。
下载链接:
https://www.omicshare.com/forum/thread-6947-1-1.html
软件的用法很简单,将fasta格式的DNA序列复制粘贴到序列输入框,或者点击“选择文件”按钮,上传DNA序列文件,然后搜索并选择核酸序列所对应的物种,比如我这里的范例文件是人的序列,方法如下图,然后只需点击“search”按钮提交任务即可。
当然,如果你有特殊需求,也可打开Advanced options,添加更多的限定条件,比如限定查找序列的范围、exon的长度等,一般情况下保持默认即可。
提交任务后,数秒后会得到预测结果,如下图,从结果中我们可以看出从提交的序列(74293bp)共找到3个基因,正链2个,负链1个;找到外显子18个,正链16个,负链2个。
同时,下方也给出了蛋白翻译序列(mRNA),如下。
点击“Show picture of predicted genes in PDF file”,以PDF格式打开预测结果,点击下载按钮可将pdf报告下载到本地,如下。
最终的预测结果如下,图中的TSS为转录起始位点(transcription start site),CDSf为起始外显子(First -Starting with Start codon),CDSi为中间外显子(internal exon),CDSl为末端外显子(last coding segment),CDSo为唯一外显子(only exon),PolA为末端polyA 尾区。
当然我也尝试提交酿酒酵母的整条Ⅰ号染色体序列,结果如下,共找到85个基因,篇幅所限,我这里只展示4个基因。
好啦,今天就分享到这里啦~
参考文献
Solovyev V, Kosarev P, Seledsov I, Vorobyev D. Automatic annotation of eukaryotic genes, pseudogenes and promoters. Genome Biol. 2006,7, Suppl 1: P. 10.1-10.12.
本文作者:基迪奥-莫北
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|