查看: 4147|回复: 21

[软件使用] HomBlocks的中文使用说明

  [复制链接]
  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

    发表于 2017.6.14 14:06:22 | 显示全部楼层 |阅读模式
    本帖最后由 雷神之锤哦 于 2017.8.4 17:48 编辑

            有童鞋来问我说看不懂我写的HomBlocks readme。好吧,我必须承认,我的英文虽然不是very terriable, 但也谈不上很流畅,也就是个poor吧。哈哈,屡屡投稿都会被点名提到这个问题。所以,暂时写写这个HomBlocks的中文教程吧,也方便大家引用。
            说是教程,也谈不上,因为这个HomBlocks实在是太简单了,连安装都不需要,我就顺便为大家演示演示吧,一遍提一提注意事项。
            首先,提几点重要的问题。

            1.关于HomBlocks的开发目的
             HomBlocks原名不叫HomBlocks。我原本自己起的名字叫做Rapid Organelle Genome Phylogeny (ROGP) Analysis Pipeline,后来我跟导师解释了下我这个LCB detection+trimming构树的方法,导师给我改得名字。(呵呵呵~,唉)
             我上一篇帖子也主要写了HomBlocks的开发目的,就是为了能让用细胞器基因组建树能快点。因为很多细胞器基因组文章又不是奔着系统进化这个方向去的,没必要为了一个简单的系统进化分析搞得非常复杂和繁琐,因而耽误太多时间。
             实际上,我得承认,主流工作都是靠单基因比对合并来构树的,而且可能存在与HomBlocks构建的树不一致的情况。这是因为基因进化的情况很复杂,即便使用多基因也解决不了这个问题。(而且我认为细胞器基因组建树,使用不同的数据集和策略都会导致树的不一致,这个是正常情况)但很多情况下,HomBlocks的树与常规树是没啥区别的。
             所以,问题在于使用者自己。你是愿意花一个月时间搞搞你自认为或者审稿人认为没有问题的alignment,还是花几个小时,迅速搞清楚这些细胞器基因组之间的进化关系?
             高效,才是HomBlocks的开发目的。


             2.关于引用
             嗯........,HomBlocks的文章现在还没出来。我投过Bioinformatics和PeerJ和MT A。Obviously被拒稿了,前者说只发表重大意义的,中者说我写的流程过于简单,后者让我转投MT B,就接受。目前............正在Genomics投稿系统里挣扎..........................。
             不是很想吐槽,但我得承认,HomBlocks的原理很简单,就是锚定算法的mauve对LCB模块进行界定,我trimming软件修整一下,合并同源模块,比出能用来建树的序列。因为我不是生信牛人,自然谈不上重构mauve,写个多线程版本的锚定算法比对软件,而且我觉得也没必要,我关注的就是效率这个问题。但是很显然,那前俩期刊的编辑不懂得我们这一线操刀小工的痛苦。如果谈创新,我能找到这些个软件,把他们组合在一起,提升科研效率,已经是创新了好伐?Whatever~
              我争取吧,整个小文章出来,不过我确实对文章不怎么看重,这个思路我已经申请了软著和专利,正在路上,文章嘛,不行我就投MT B,反正今年也是SCIE了。大家引用的话,就先这么写就好:the genome-wide alignment of XXX genomes was constructed by HomBlocks (https://github.com/fenghen360/HomBlocks), resulting in XXXXX characters of each species, which including all PCGs and rRNA genes.


               3.接下来就是使用了。
               3.1首先是安装
               安装嘛,很简单。解压下,然后把相应的一些脚本和软件变的可执行化就行。
               下载地址https://github.com/fenghen360/HomBlocks

               下载完之后,上传到你的linux服务器也好,或者放到你的linux工作站或者你的linux系统电脑上。         
               # 解压缩
               unzip HomBlocks-master.zip

              # 然后进入HomBlocks-master目录
              cd HomBlocks-master
              #可以先看看HomBlocks的参数
              perl Homblocks.pl

              # 把HomBlocks-master中bin目录文件夹下的程序都调整成可执行化
              cd HomBlocks-master
              cd bin
              chmod 755 *

              # 将PartitionFinderV1.1.1文件夹下文件可执行化
              cd ..
              cd PartitionFinderV1.1.1
              chmod 755 *
              chmod 755 PartitionFinder*
              cd programs
              chmod 755 *
              cd ..
              cd partfinder
              chmod 755 *


              3.2 运行示例
             HomBlocks是命令行工具,无图形用户界面,在Linux操作系统的命令行界面进行操作。在软件安装目录下,输入可执行文件名称perl HomBlocks.pl, 回车后,如图所示,提示会提示使用说明:

              以36个啮齿动物线粒体基因组序列来快速构建序列比对文件为例:
             (1)可以指定存放序列的文件夹作为输入,程序则自动识别改文件夹下中的序列文件,完成整个序列构建过程。程序命令如下:

              perl HomBlocks.pl --align --path=~/HomBlocks/Xenarthrans/fasta/ -out_seq=Xenarthrans.output.fasta  --mauve-out=Xenarthrans.mauve.out

              各参数意义:
                                --align 参数表示执行序列预比对模式。
                                --path=~/HomBlock/Xenarthrans/fasta/ 参数指定存放核酸序列的文件夹
                                -out_seq=Xenarthrans.output.fasta 参数指定生成的序列文件名。
                                --mauve-out=Xenarthrans.mauve.out参数指定预比对生成的中间文件名。

             程序截图如下:

             运行后,首先会打印识别的序列文件的路径和名称,并要求确认是否正确。如无识别错误,则可以回车继续执行程序;如指定文件错误,则可使用快捷键Ctrl+C终止程序。

            (2)可以输入已经使用progressive Mauve完成比对的结果文件作为输入文件(LCB长度过滤或者使用其他trimmer软件,而无需重新运行progressive Mauve进行比对)。程序命令如下:

            perl HomBlocks.pl -in=Xenarthrans.mauve.out -out_seq=Xenarthrans.output.fasta -number=36 -min=200 -method=Gblocks

            各参数意义:
                              -in=Xenarthrans.mave.out 参数指定输入的预比对的结果文件。
                              -out_seq=Xenarthrans.output.fasta 参数指定生成的序列文件名。
                              -number=36 参数指定参与比对的物种个数。
                              -min=200 参数指定模块序列修剪后保留的最小长度阈值,小于该值则舍去。
                              -method=Gblocks 参数表明序列修剪采用子程序Gblocks来进行。

            程序截图如下(部分):

                               出现运行提示,表示程序则运行成功。

          (3)可以再以上2步,任意一种运行方式中添加--PartitionFinder。--PartitionFinder参数添加后,将会使用程序生成的细胞器基因组快速比对序列按照模块进行序列进行划分并进行核酸替换最佳模型选择,为下游系统发生分析提供模型参数和数据划分集。但LCB仅检测出一个的时候,PartitionFinder会报错,多个LCB 模块则不会报错。

           3.3 结果及文件
          (1)任意一种运行模式将产生--out_seq= 参数指定的结果文件。该文件为细胞器基因组的最终比对结果序列。如上例,生成结果文件Xenarthrans.output.fasta 该文件可用于下游的系统发生分析。同时,报告提取模块数量及位置分布,如下图所示:



          (2)指定--PartitionFinder参数后,将生成名为partitionfinder_dir的文件夹,其中包含着best_scheme.txt结果文件,该文件定义了模块划分下,序列的最佳核酸替换模型和组合参数。如图所示:



            关于生成的比对好的fasta文件,大家可以用任意比对软件进行查看。如图:




             最后关于可视化,还是用我推荐的circoletto去做吧(http://tools.bat.infspire.org/circoletto/)





    文章已经在Genomics上发布了:http://www.sciencedirect.com/sci ... i/S088875431730068X小伙伴,别忘了引用哈









    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x

    评分

    参与人数 1奥币 +30 贡献 +10 收起 理由
    基迪奥-周煌凯 + 30 + 10 楼主V5!

    查看全部评分

    回复

    使用道具 举报

  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

     楼主| 发表于 2017.6.14 14:08:05 | 显示全部楼层
    高等植物的示例大家自己跑跑吧,这里就不展示了
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    好棒
    2018.10.30 09:38
  • 签到天数: 193 天

    连续签到: 1 天

    [LV.7]常住居民III

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    26
    奥币
    3367
    积分
    1567
    注册时间
    2016.1.13
    在线时间
    253 小时

    突出贡献优秀版主


    发表于 2017.6.14 15:21:22 | 显示全部楼层
    神,神,神!
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2018.3.24 13:42
  • 签到天数: 191 天

    连续签到: 1 天

    [LV.7]常住居民III

    中华鲟

    Rank: 5Rank: 5

    主题
    4
    奥币
    55
    积分
    753
    注册时间
    2016.5.31
    在线时间
    362 小时

    发表于 2017.6.14 22:26:21 | 显示全部楼层
    牛逼啊
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    3 小时前
  • 签到天数: 809 天

    连续签到: 15 天

    [LV.10]以坛为家III

    中华鲟

    Rank: 5Rank: 5

    主题
    7
    奥币
    2855
    积分
    964
    注册时间
    2016.4.8
    在线时间
    336 小时

    最佳新人


    发表于 2017.6.15 08:40:04 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情

    2017.11.10 13:58
  • 签到天数: 353 天

    连续签到: 2 天

    [LV.8]以坛为家I

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    422
    奥币
    7505
    积分
    6612
    注册时间
    2015.11.23
    在线时间
    952 小时

    宣传达人优秀版主


    发表于 2017.6.15 16:48:50 | 显示全部楼层
    图片没有插入到文章中
    有问题请发贴提问
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

     楼主| 发表于 2017.6.15 18:29:13 | 显示全部楼层
    本帖最后由 雷神之锤哦 于 2017.6.15 20:38 编辑
    小瑶 发表于 2017.6.15 16:48
    图片没有插入到文章中

    不会弄啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019.8.23 09:48
  • 签到天数: 86 天

    连续签到: 1 天

    [LV.6]常住居民II

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    666
    积分
    174
    注册时间
    2017.1.20
    在线时间
    39 小时

    发表于 2017.6.17 01:54:22 | 显示全部楼层
    很好,谢谢!
    回复

    使用道具 举报

  • TA的每日心情
    忙~
    2019.7.16 20:14
  • 签到天数: 672 天

    连续签到: 1 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    0
    奥币
    2517
    积分
    1129
    注册时间
    2016.1.15
    在线时间
    256 小时

    活跃会员


    发表于 2017.6.17 08:07:29 | 显示全部楼层
    试几次,真心不错!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    好棒
    2019.8.27 11:18
  • 签到天数: 98 天

    连续签到: 1 天

    [LV.6]常住居民II

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    384
    积分
    160
    注册时间
    2016.12.10
    在线时间
    27 小时

    发表于 2017.6.17 13:15:53 | 显示全部楼层
    表示 看不懂   
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

     楼主| 发表于 2017.6.17 13:20:34 | 显示全部楼层

    啥?哪里啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    6 天前
  • 签到天数: 480 天

    连续签到: 5 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    13
    奥币
    3188
    积分
    1061
    注册时间
    2016.9.7
    在线时间
    156 小时

    突出贡献


    发表于 2017.6.19 17:09:04 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2019.7.26 09:10
  • 签到天数: 509 天

    连续签到: 1 天

    [LV.9]以坛为家II

    中华鲟

    Rank: 5Rank: 5

    主题
    14
    奥币
    1264
    积分
    715
    注册时间
    2017.3.27
    在线时间
    135 小时

    发表于 2017.6.20 16:59:22 | 显示全部楼层
    要会编程的,好想学
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.8.24 15:20
  • 签到天数: 43 天

    连续签到: 1 天

    [LV.5]常住居民I

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    260
    积分
    51
    注册时间
    2017.4.6
    在线时间
    22 小时

    发表于 2017.6.21 22:17:02 | 显示全部楼层
    简单,方便,易操作但就是(http://tools.bat.infspire.org/circoletto/)网站中,图字体怎么改变?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

     楼主| 发表于 2017.6.21 22:17:59 | 显示全部楼层
    高小水 发表于 2017.6.21 22:17
    简单,方便,易操作但就是(http://tools.bat.infspire.org/circoletto/)网站中,图字体怎么改变? ...

    可以生成svg格式,后期用矢量图操作软件比如AI,corelDRAW修改下
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.8.24 15:20
  • 签到天数: 43 天

    连续签到: 1 天

    [LV.5]常住居民I

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    260
    积分
    51
    注册时间
    2017.4.6
    在线时间
    22 小时

    发表于 2017.6.22 14:01:56 | 显示全部楼层
    雷神之锤哦 发表于 2017.6.21 22:17
    可以生成svg格式,后期用矢量图操作软件比如AI,corelDRAW修改下

    非常感谢,我这就试试{:8_457:}
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.10.14 15:37
  • 签到天数: 1 天

    连续签到: 1 天

    [LV.1]初来乍到

    草履虫

    Rank: 2

    主题
    0
    奥币
    23
    积分
    5
    注册时间
    2017.10.14
    在线时间
    1 小时

    发表于 2017.10.14 15:34:01 | 显示全部楼层
    您好,可以用于细菌的全基因组建树吗?mafft比对实在花了很多时间。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.13 14:50
  • 签到天数: 119 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    6
    奥币
    1227
    积分
    569
    注册时间
    2016.6.16
    在线时间
    285 小时

     楼主| 发表于 2017.10.15 13:31:11 | 显示全部楼层
    小小悦 发表于 2017.10.14 15:34
    您好,可以用于细菌的全基因组建树吗?mafft比对实在花了很多时间。 ...

    可以的,不过得花个几天时间,效果得看你使用的数据是啥样的。我测试过,没问题。你可以加我QQ:360795768
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.10.14 15:37
  • 签到天数: 1 天

    连续签到: 1 天

    [LV.1]初来乍到

    草履虫

    Rank: 2

    主题
    0
    奥币
    23
    积分
    5
    注册时间
    2017.10.14
    在线时间
    1 小时

    发表于 2017.10.15 20:18:49 | 显示全部楼层
    雷神之锤哦 发表于 2017.10.15 13:31
    可以的,不过得花个几天时间,效果得看你使用的数据是啥样的。我测试过,没问题。你可以加我QQ:360795768 ...

    好的,谢谢!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.10.16 18:42
  • 签到天数: 3 天

    连续签到: 2 天

    [LV.2]偶尔看看I

    草履虫

    Rank: 2

    主题
    0
    奥币
    81
    积分
    7
    注册时间
    2017.7.1
    在线时间
    3 小时

    发表于 2018.5.5 14:48:31 | 显示全部楼层
    检测不到文件时为什么呀?
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表