查看: 2271|回复: 6

[流程分析] 如何在5分钟内拿到细胞器基因组的进化树

[复制链接]
  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1285
    积分
    587
    注册时间
    2016.6.16
    在线时间
    304 小时

    发表于 2018.5.8 00:47:43 | 显示全部楼层 |阅读模式
    本帖最后由 雷神之锤哦 于 2018.5.8 00:59 编辑

         雷神之锤的我,之前设计了一个HomBlocks流程,可以很方便地帮助大家构建细胞器基因组的比对序列,再用来建树。大家如果不明所以的话,可以搜索查看基迪奥论坛上我的其他的帖子,就知道这个流程具体怎么运行,最终用来干什么了。
         HomBlocks也发表在了Genomics上,地址:http://www.sciencedirect.com/sci ... i/S088875431730068X
         当时发帖的时候,号称一天之内拿到细胞器基因组树。自然,在序列数目不多的时候,HomBlocks的运行还是比较快的,一天之内拿到比对好的序列,用MEGA跑一下NJ树还是没有问题的。但是随着序列数目的增加、物种亲缘性的疏远、序列长度差异越大或者清一色使用叶绿体基因组,会导致软件运行的时间还是比较久。比如使用70个叶绿体序列,来跑HomBlocks可能会花上几天时间。
         因为Mauve的比对只能单线程运行,所以速度上没有办法再提高。
         虽然HomBlocks的依然能跑出结果,但是让人等待的过程也实在是煎熬。什么时候能跑出来?跑到哪里了?程序是不是中断了?
         再虽然,HomBlocks相比传统手动方法(手动挑取基因序列进行比对再合并序列)在效率上和简便性上,已经算得上很不错啦。起码你只需要等待,无须手动,也不怕出来的序列有问题。
         但是!就真没有更快的方法了吗?
         雷神の锤告诉你,还真有!我给你搞出来了!现在的方法号称:
         “五!分!钟!内!拿!到!细!胞!器!基!因!组!的!进!化!树!”。
         我们这个新的方法(也算不上什么流程),叫做BLAST2OGMSA。
         这个新方法的文章题目我也想好了——BLAST2OGMSA: an convenient way to construct whole organelle genomes alignment to facilitate phylogeny analysis.
          大家看到这个题目大概也了解了,为什么我们能在5分钟之内拿到这么个东西了。
          比对的话,什么最快?mafft?clustalw?muscle? No, No, No, No。是BLAST!
          不然NT数据库那么大,你怎么能够那么快速地在网页上检索序列呢?
          那我们需要自行构建序列的库,然后两两比对,再解析blast结果吗?
          不需要!
          正常的思路的确是这样,利用blast的快速比对(虽然在比对精度上不如其他正统序列比对软件),来解析blast结果。但是,还是挺麻烦的。首先要把blast结果保存成xml格式,然后再提取序列,序列再定位,再提取.............然后你会发现,对位还是有问题,还不如直接用mafft来比呢。
           但BLAST2OGMSA直接避开了这么个过程,直接使用ncbi网页版BLAST工具就行了。
           BLAST2OGMSA就是一个脚本,只需要你提供两个文件就行。
           那这两个文件从哪来?

           那顺便说一下BLAST2OGMSA的使用方法:
           1)  首先,将你需要构建系统发生树的所有序列,合并在一个文件里。
           2)打开ncbi的BLAST工具, 点开Align two or more sequences选项。

           3)将你准备好的序列,随便选一个,放入第一栏;将所有序列选中,放入第二栏,然后比对啦。


           4)在蹦出来的结果页面,点开MSA View项。


           5)在蹦出来的MSA View界面,将blast比对出来的结果download下来(这个是最初的结果,但不能用,我们需要从中提取有效信息),举个例子我们保存成X.aln文件。

           6)在原来的结果界面,在下部分的结果部分,我们选中所有序列,选择download,文件名就默认为seqdump.txt就好。



           7)我们有了X.aln和seqdump.txt两个文件,然后运行BLAST2OGMSA:

           perl BLAST2OGMSA.pl -method=Gblocks X.aln seqdump.txt output.fasta


           然后产生的output.fasta就是我们可以用来建树的序列啦!然后简单跑一下NJ:






             还记得我第一篇帖子中的36个啮齿类动物线粒体的系统发生树吗?结构一致哦,节点的支持度都OK!这个过程花了多长时间?5分钟都没有吧!
             BLAST2OGMSA也跟HomBlocks提供了4中序列修剪方法:Gblocks,trimAl,BMGE,Noisy。所以大家用的时候,可以按照自己的需要进行选择。
             BLAST2OGMSA的用法也实在很简单,没有别的参数,只需要按顺序把文件列好就行了,可以参考例子中的命令,如果不知道怎么用,那么直接perl BLAST2OGMSA.pl查看一下就行了。

              BLAST2OGMSA的地址:https://github.com/fenghen360/BLAST2OGMSA
              下载解压之后,需要将bin目录下的所有文件可执行化:chmod 755 * 就行。
              刚有空写出来,readme都没来得及详细写,大家忽略readme就行,我有空再好好写写。          大家引用的话,就先这么写就好:the genome-wide alignment of XXX genomes was constructed by BLAST2OGMSA (https://github.com/fenghen360/BLAST2OGMSA), resulting in XXXXX characters of each species, which including all PCGs and rRNA genes.


    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x

    评分

    参与人数 1奥币 +25 贡献 +10 收起 理由
    基迪奥-周煌凯 + 25 + 10 很实用,不错。

    查看全部评分

    回复

    使用道具 举报

  • TA的每日心情
    yes!
    3 天前
  • 签到天数: 866 天

    连续签到: 6 天

    [LV.10]以坛为家III

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    20
    奥币
    4738
    积分
    1370
    注册时间
    2016.5.11
    在线时间
    438 小时

    发表于 2018.5.8 08:29:03 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情

    2019.9.23 10:01
  • 签到天数: 101 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    392
    奥币
    1108
    积分
    5613
    注册时间
    2018.4.19
    在线时间
    895 小时

    推广达人宣传达人


    发表于 2018.5.8 10:25:59 | 显示全部楼层
    真棒!!!
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    昨天 20:11
  • 签到天数: 1001 天

    连续签到: 3 天

    [LV.10]以坛为家III

    中华鲟

    Rank: 5Rank: 5

    主题
    0
    奥币
    3484
    积分
    603
    注册时间
    2016.5.16
    在线时间
    229 小时

    发表于 2018.5.9 23:33:35 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    好棒
    2018.10.30 09:38
  • 签到天数: 193 天

    连续签到: 1 天

    [LV.7]常住居民III

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    26
    奥币
    3434
    积分
    1568
    注册时间
    2016.1.13
    在线时间
    254 小时

    突出贡献优秀版主


    发表于 2018.5.10 11:49:52 | 显示全部楼层
    牛啊,大神
    回复

    使用道具 举报

  • TA的每日心情

    2020.2.12 11:36
  • 签到天数: 201 天

    连续签到: 1 天

    [LV.7]常住居民III

    钵水母

    Rank: 3Rank: 3

    主题
    4
    奥币
    67
    积分
    176
    注册时间
    2016.9.14
    在线时间
    69 小时

    发表于 2018.5.12 14:40:26 | 显示全部楼层
    啥也不说了,点赞点赞!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    5 天前
  • 签到天数: 80 天

    连续签到: 1 天

    [LV.6]常住居民II

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    418
    积分
    223
    注册时间
    2017.10.10
    在线时间
    29 小时

    发表于 2018.8.24 12:40:04 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表