查看: 5214|回复: 7

[软件使用] VCF2Dis 软件发布 【计群体 VCF算里样品之间的差异矩阵】

[复制链接]

帝王蝶

Rank: 4

主题
6
注册时间
2016.5.18
在线时间
54 小时

发表于 2017.8.18 13:52:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 hewm2008 于 2017.8.18 13:54 编辑

欢迎使用VCF2Dis
https://github.com/BGI-shenzhen/VCF2Dis

程序介绍:
程序最高效率  通计群体 VCF算里样品之间的差异矩阵( p-distance matrix

而得到差异矩阵( p-distance matrix),即可以立刻得到其nj-tree.
具体见上面网页介绍


VCF2Dis: A new simple and efficient software to calculate p-distance matrix based Variant Call Format

  • Install


     Just [make] or [sh make.sh ] to compile this software. the final software can be found in the Dir [bin/VCF2Dis]
       tar -zxvf  VCF2DisXXX.tar.gz        cd VCF2DisXXX;        make ; make clean        ./bin/VCF2Dis

  • Example


    • Parameter description:

        Usage: VCF2Dis -InPut  <in.vcf>  -OutPut  <p_dis.mat>  
               -InPut          <str>     Input GATK VCF genotype File
               -OutPut       <str>     OutPut Sample p-Distance matrix  
               -SubPop      <str>     SubGroup SampleList of VCFFile [ALLsample]
               -KeepMF                    Keep the Middle File diff & Use matrix
               -help                          Show this help [hewm2008 v1.09]


    • To Create the p_distance matrix

# 2.1) To new all the sample p_distance matrix based VCF, run VCF2Dis directly   
      ./bin/VCF2Dis        -InPut        in.vcf.gz        -OutPut p_dis.mat
# 2.2) To new sub group sample p_distance matrix ; Pput their sample name into File sample.list
     ./bin/VCF2Dis        -InPut        in.vcf.gz        -OutPut p_dis.mat  -SubPop  sample.list

    • construct nj-tree and present it (need deal with Other software)

      #    3.1 Run  PHYLIP        #   After p_distance done , software PHYLIP 3.69 (http://evolution.genetics.washington.edu/phylip.html) ,with neighbor-joining method can was used to construct the phylogenetic tree on the basis of this  p_distance matrix;         
        PHYLIPNEW-3.69.650/bin/fneighbor  -datafile p_dis.matrix  -outfile tree.out1.txt -matrixtype s -treetype n -outtreefile tree.out2.tre     
#    3.2 Run  MEGA        #    The MEGA6 (http://www.megasoftware.net/) was used to present the phylogenetic tree based this file [tree.out2.tre].     
  

    • you can see the neighbor-joining tree and save it as PDF format

  • Introduction

To new the p_distance matrix besed the VCF file. the more infomation about the p_distance matrix ,see this website:http://evolution.genetics.washington.edu/phylip/doc/distance.html
The VCF SNPs datasets were used to calculate p-distance between individuals, according to the follow formula to operate the sample i and sample j genetic distance:
            D_ij=1/L *[(sum(d(l)_ij))]

Where L is the length of regions where SNPs can be identified, and given the alleles at position l are A/C:
            d(l)_ij=0.0     if the genotypes of the two individuals were AA and AA;           
            d(l)_ij=0.5     if the genotypes of the two individuals were AA and AC;           
            d(l)_ij=0.0     if the genotypes of the two individuals were AC and AC;            
            d(l)_ij=1.0     if the genotypes of the two individuals were AA and CC;            
            d(l)_ij=0.0     if the genotypes of the two individuals were CC and CC;


  • Results

some LD decay images which I draw in the paper before.
5)Discussing

评分

参与人数 1奥币 +5 贡献 +6 收起 理由
莫北 + 5 + 6 Good job!

查看全部评分

回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
0
注册时间
2016.1.15
在线时间
261 小时

活跃会员


发表于 2017.8.19 08:37:00 | 显示全部楼层
谢谢分享!
早上好!
回复

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
23
注册时间
2015.12.29
在线时间
218 小时

突出贡献优秀版主


发表于 2017.8.23 09:19:26 | 显示全部楼层
感谢分享,虽然没看懂
。。。。。。
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
200
注册时间
2017.7.3
在线时间
517 小时

活跃会员荣誉管理


发表于 2017.8.24 09:05:19 | 显示全部楼层
觉得很厉害,收藏
新的一天加油!
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
7
注册时间
2016.4.7
在线时间
34 小时

发表于 2018.3.29 11:20:51 | 显示全部楼层
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
注册时间
2016.11.16
在线时间
23 小时

发表于 2018.6.6 15:36:03 | 显示全部楼层
用tassel可以直接算出来啊
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
6
注册时间
2016.5.18
在线时间
54 小时

 楼主| 发表于 2018.6.19 12:24:37 | 显示全部楼层
wtt4567 发表于 2018.6.6 15:36
用tassel可以直接算出来啊

你可以比较速度,时间和内存 及结果等
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.11.12
在线时间
9 小时

发表于 2018.9.30 15:30:03 | 显示全部楼层
厉害!真的很好用!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表