查看: 4551|回复: 15

[动植物重测序] 进化选择统计量问题求教

  [复制链接]
  • TA的每日心情

    2018.3.9 10:16
  • 签到天数: 96 天

    连续签到: 1 天

    [LV.6]常住居民II

    超级版主

    Rank: 12Rank: 12Rank: 12

    主题
    18
    奥币
    2240
    积分
    1299
    注册时间
    2016.3.11
    在线时间
    163 小时

    突出贡献优秀版主荣誉管理


    发表于 2016.4.9 08:45:48 | 显示全部楼层 |阅读模式

    马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    本帖最后由 yuzhe891 于 2016.4.9 08:51 编辑

    昨天看了周老师的“群体遗传与进化选择”视频,我没有做过相关的东西,所以有些概念还是比较模糊的,在这里求教。

    1.视频里提到的基本概念w、π、基于群体内部的Tajima D统计量、Fay & Wu's H统计量,还有基于群体间的Fst,这几个概念通过周老师循序讲解我大体明白了他们的关系,也明白了他们的目的性。平时我还看到一些统计量,比如说EHH,LRH ,iHS,LDD;McDonald和Kreitman (MK)测验,HKA测验;还有PAML里的Ka/Ks,还有溯祖理论,这些统计量也是来算选择的,怎么理解呢,我完全不知道他们的应用~

    2.我现在要做选择分析,我知道一种检验的结果往往不能给出可靠的结果,需要结合多种检验以及具体的生物学背景才能给出比较合理的解释。那我应该怎么选择合适的统计量呢?原则有哪些呢?是不同的统计量适用的选择压不同,怎么个不同?还是说有别的差别?


    3.我们老师非常热爱KaKs,通过这种方法研究中国地方品种(动物,原谅我物种就不说了,明白人肯定猜个八九不离十了)的进化关系,基因组上通过kaks找到选择区间就往下继续做了,这个靠谱么?


    4.我自己的课题做定位,F0代一个是中国地方品种,另一个是人工选育十几代的品种,高遗传力数量性状,GWAS结果很理想,现在也想用受选择区间分析一下,做了Fst发现GWAS的QTL(1Mb大小)并没有明显的选择信号,离QTL大概10M有选择信号。这个的可能原因有哪些呢?我自己想的包括①soft sweep,培育代次少?②标记密度导致遗传多样性丢失(可是我的密度也不低啊,4k/SNP,地方品种的LD decay也还好吧)③Fst统计量不适合?换别的统计量?④其他原因?还有别的可解释的理论么?

    等待答案中~~~~
    回复

    使用道具 举报

  • TA的每日心情
    忙~
    2019.1.23 23:11
  • 签到天数: 104 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    45
    奥币
    6044
    积分
    4932
    注册时间
    2015.12.5
    在线时间
    508 小时

    活跃会员论坛元老


    发表于 2016.4.9 10:18:06 | 显示全部楼层
    (1)选择压力分析的算法是在太多了。我比较了解的基本都是两种思路:a) 比较基因组不同区域多样性的变化,例如 π、Tajima D 类的统计方法;b)非同义/同义突变比率,例如Ka/Ks,MK检验。你提到的各种方法,都这两种算法的变形。其他太复杂的算法,就表示看不懂了。
    (2)各个方法的适用范围,可以参考樊江龙《生物信息学札记》的第八章(见附件)
    (3)Ka/ks 是一种最粗糙的统计方法,我认为假阳性极大。而且更多使用在物种间的比较。你说的是同一个物种的不同品种,不大适合使用这个策略。物种内,应该使用统计多样性类的算法,例如:π、Fst等;
    (4)十几代的人工选择理论上很强了。 我认为原因包括:a)这个位点的选择信号不是特别强; b)这里Fst算法的效率不是特别好。Fst 想证明 群体间个体的平均差异 > 群体内个体间的平均差异。当两个群体都有选择压的时候,且选择方向相反的时候,信号最强。而这里,你的F0群体没有受到选择,而Fn 群体完全起源于F0群体,所以相当于降低了一半选择信号。所以,建议你可以结合一些非群体间比较的方法,分析一下Fn群体的选择压。例如 π、Tajima D等。c)你使用SNP密度应该足够了(如果是每4k,1个SNP的话),但是否统计过这些SNP在原始群体的MAF。难道你使用的是基因芯片?基因芯片的SNP位点在中国猪种的MAF往往不够高,会降低检测效果。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.9 10:16
  • 签到天数: 96 天

    连续签到: 1 天

    [LV.6]常住居民II

    超级版主

    Rank: 12Rank: 12Rank: 12

    主题
    18
    奥币
    2240
    积分
    1299
    注册时间
    2016.3.11
    在线时间
    163 小时

    突出贡献优秀版主荣誉管理


     楼主| 发表于 2016.4.9 10:44:50 | 显示全部楼层
    本帖最后由 yuzhe891 于 2016.4.9 15:33 编辑
    基迪奥-周煌凯 发表于 2016.4.9 10:18
    (1)选择压力分析的算法是在太多了。我比较了解的基本都是两种思路:a) 比较基因组不同区域多样性的变化, ...

    谢谢周老师!

    我以前也看过樊龙江的第八章,表示看不懂N年了,昨天看了视频才有点开窍

    我可能没说明白的我的群体,我有F0代两个品种,其中一个品种就是地方品种(纯种保种)(这个会看到选择压吗?),另一个是对目标性状已经选育了十几代的人工品种,二者的目的性状已经差异非常显著。然后实验室利用这样的F0构建了AIL家系,自然传代,也就是Fn代都没有任何的选择,只为了增加重组。在这种结构下,怎么分析选择比较好呢?(ps:我的SNP是自己GBS做的,MAF按照0.1过滤了,还需要增加别的检查吗)
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2019.1.23 23:11
  • 签到天数: 104 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    45
    奥币
    6044
    积分
    4932
    注册时间
    2015.12.5
    在线时间
    508 小时

    活跃会员论坛元老


    发表于 2016.4.9 11:49:42 | 显示全部楼层
    yuzhe891 发表于 2016.4.9 10:44
    谢谢周老师!

    我以前也看过樊江龙的第八章,表示看不懂N年了,昨天看了视频才有点开窍

    那你选择压力分析的材料是如何选择的,从Fn选择个体? 选择什么样的个体进行选择压力分析?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.9 10:16
  • 签到天数: 96 天

    连续签到: 1 天

    [LV.6]常住居民II

    超级版主

    Rank: 12Rank: 12Rank: 12

    主题
    18
    奥币
    2240
    积分
    1299
    注册时间
    2016.3.11
    在线时间
    163 小时

    突出贡献优秀版主荣誉管理


     楼主| 发表于 2016.4.9 15:26:02 | 显示全部楼层
    基迪奥-周煌凯 发表于 2016.4.9 11:49
    那你选择压力分析的材料是如何选择的,从Fn选择个体? 选择什么样的个体进行选择压力分析? ...

    实验原来都是基于QTL mapping设计的,没想着在选择进化上做多少东西。我现在选择的只是F0,F0不同品种亲本各20个吧,我觉得Fn没法做啊,F0做了Fst结果不理想,想换别的统计方法~~~
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2019.1.23 23:11
  • 签到天数: 104 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    45
    奥币
    6044
    积分
    4932
    注册时间
    2015.12.5
    在线时间
    508 小时

    活跃会员论坛元老


    发表于 2016.4.10 00:54:28 | 显示全部楼层
    你这样的材料,理论上Fn杂交后代做GWAS的结果是比较准确的,因为人工控制的杂交后代群体结构比较均一,假阳性比较低。
    但这个案例中,你选择压力分析得到的位点,未必与你关心的性状相关:
    (1)来源随机漂变
    而从F0 两个品种进行群体选择压力分析的结果,很有可能来自于群体结构导致随机漂变,而非正选择导致的位点。换个大白话,某个区域即使没有功能位点,没有受到正、负选择,在群体有效规模非常有限的情况下(人工驯化条件,一般群体多样性比较差),由于随机发生的一些基因型频率波动,也会呈现出显著的正选择信号。
    (2)与其他性状相关的受选择位点。
    因为选择是可能涉及多个性状的,未必优先指向你关心的性状。例如,尽管你关心生长速度,但实际情况下抗病性或许会受到更强的选择。所以,你关心的QTL区域未必就有最强的信号。

    至于哪个算法可以优化得到更好的结果,我还真的没有特别好的建议。我建议你尝试去解释那些受选择的位点是什么,不仅仅局限在你的目标QTL。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.3.9 10:16
  • 签到天数: 96 天

    连续签到: 1 天

    [LV.6]常住居民II

    超级版主

    Rank: 12Rank: 12Rank: 12

    主题
    18
    奥币
    2240
    积分
    1299
    注册时间
    2016.3.11
    在线时间
    163 小时

    突出贡献优秀版主荣誉管理


     楼主| 发表于 2016.4.10 17:29:58 | 显示全部楼层
    基迪奥-周煌凯 发表于 2016.4.10 00:54
    你这样的材料,理论上Fn杂交后代做GWAS的结果是比较准确的,因为人工控制的杂交后代群体结构比较均一,假阳 ...

    那就还是只能做做试试了,要想把两种方法的结果融合在一起,不好讲故事了。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2019.1.23 23:11
  • 签到天数: 104 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    45
    奥币
    6044
    积分
    4932
    注册时间
    2015.12.5
    在线时间
    508 小时

    活跃会员论坛元老


    发表于 2016.4.10 18:40:06 | 显示全部楼层
    yuzhe891 发表于 2016.4.10 17:29
    那就还是只能做做试试了,要想把两种方法的结果融合在一起,不好讲故事了。 ...

    可以发两篇文章
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    343
    积分
    51
    注册时间
    2016.4.23
    在线时间
    7 小时

    发表于 2016.4.24 19:41:18 | 显示全部楼层
    学习了~
    回复

    使用道具 举报

  • TA的每日心情

    2017.6.21 19:22
  • 签到天数: 101 天

    连续签到: 2 天

    [LV.6]常住居民II

    帝王蝶

    Rank: 4

    主题
    5
    奥币
    642
    积分
    291
    注册时间
    2016.3.16
    在线时间
    37 小时

    发表于 2016.6.12 10:25:35 | 显示全部楼层
    学习了
    回复

    使用道具 举报

  • TA的每日心情
    害羞
    2018.11.5 15:16
  • 签到天数: 110 天

    连续签到: 1 天

    [LV.6]常住居民II

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    304
    积分
    134
    注册时间
    2016.9.5
    在线时间
    76 小时

    发表于 2016.9.28 19:32:15 | 显示全部楼层
    学习了
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2019.10.29 14:32
  • 签到天数: 735 天

    连续签到: 1 天

    [LV.9]以坛为家II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    23
    奥币
    3477
    积分
    1218
    注册时间
    2015.12.29
    在线时间
    215 小时

    突出贡献优秀版主


    发表于 2017.5.1 10:59:50 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    6 天前
  • 签到天数: 87 天

    连续签到: 1 天

    [LV.6]常住居民II

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    669
    积分
    177
    注册时间
    2017.1.20
    在线时间
    40 小时

    发表于 2017.6.9 04:44:48 | 显示全部楼层
    不错,谢谢分享!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    no
    2019.3.21 11:36
  • 签到天数: 93 天

    连续签到: 1 天

    [LV.6]常住居民II

    中华鲟

    Rank: 5Rank: 5

    主题
    6
    奥币
    457
    积分
    603
    注册时间
    2016.5.22
    在线时间
    100 小时

    发表于 2018.5.3 16:11:22 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    草履虫

    Rank: 2

    主题
    3
    奥币
    70
    积分
    36
    注册时间
    2018.12.11
    在线时间
    14 小时

    发表于 2019.2.15 14:28:25 | 显示全部楼层
    我想看我的基因有没有被进化选择,我现在只有SNP,没有序列,请问有没有什么软件可以直接用SNP格式做核酸多态性分析?
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    39
    积分
    15
    注册时间
    2019.2.18
    在线时间
    7 小时

    发表于 2019.10.22 18:09:30 | 显示全部楼层
    感谢分享
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表