首先,标题一定要引人注目。 经常在各大Q群,各大论坛上看到诸如以下问题:
测了转录组,组装出来的Unigenes 缺胳膊短腿,直接没有全长CDS?5端 不全?3端不全?老板让必须克全长怎么办?要做转基因啦,没有CDS全长咋整?实验技术高超的朋友,比如我,直接就上race,分分钟拿到全长CDS,然并卵,条条大路你不走,偏偏要去穿树林?浪费时间不要紧,经费能搞几个试剂盒?我这一剂,帮你省钱,别客气。
1. 打开 TBtools,亦即传说中的 淘宝工具,可以看到随机出现的名人名言,先学习一下
2. 选择‘Blast’->选择‘eGenomeWalking’
3.1 如果之前没有建立数据库,那么点击‘new fastq db’直接从fastq文件开始建数据库,建好的数据库以后都能用
3.2 如果已经有建立好的数据库,或者数据库初始化完毕,那么设置数据库文件,点击‘initialize’,进行初始化。初始化成功,则可以选择相应的数据库。
4. 黏贴用于延伸3端的序列,如果要延伸5端,请使用Sequences Toolkits下面的Sequences manipulator反向互补,随后点击开始
5. 等待运行,随后会弹出选择框,其中第一行对应的是hookSeq 也就是用于抓取的原始序列,第二行及其后对应的是所有比对上的reads,人工选择自己信任的区域,或者区域对应的终点(注意,如果选择区域的终点列比hookSeq结束列前,那么会缩短序列,如果选择的区域和hookSeq有重叠,那么如果选择区域中对应位点最大频次的碱基与hookSeq不同,那么会矫正hookSeq,这个是高级功能,基本不用),点击continue, 则增加的序列或者调整后的序列会替换点原始输入序列,在本例中,是延伸3端
6. 重复这个步骤,直到人工判定不能再延伸或者是不需要延伸即可。如果是要检验结果,则点击Check By Pileup Grapher,则会出现对应的reads覆盖当前序列的图,也可以直接自己到NCBI或者其他工具做序列完整性和可靠性检验
*. 相同的原理,用于转录组测序数据,那么是做e-Race,用于重测序或者基因组测序数据,那么是做e-Tail或者e-GenomeWalking
*. 有朋友提问,对于重复序列怎么办?这个只能靠用户,用户决定什么时候延伸,延伸多少。
搞定... 下地,打扫实验室卫生,写这个教程足足跨越了6个小时。
洗澡,看剧,拜拜
|