查看: 2371|回复: 6

[动植物重测序] GWAS分析没有显著结果该怎么办?

[复制链接]
  • TA的每日心情
    忙~
    2019.7.16 19:36
  • 签到天数: 170 天

    连续签到: 1 天

    [LV.7]常住居民III

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    191
    奥币
    4244
    积分
    2732
    注册时间
    2017.7.3
    在线时间
    403 小时

    活跃会员荣誉管理


    发表于 2018.1.19 09:52:06 | 显示全部楼层 |阅读模式
    全基因组关联分析(GWAS)目标很简单:找到与表型相关的分子标记,并以其为线索找到对应的基因。其中,我们最不想碰到的结果就是分析做完了,一个显著相关的位点都没有(如图1,所有位点的显著性都在阈值之下)。

    这个很大的原因是我们关注性状往往由微效多基因控制,单一位点对表型的贡献本身不强。再加上多重检验校正的影响,更难以达到显著的标准。
    关于《显著检验与多重检验校正》,可以阅读我们Omicshare论坛主题帖:http://www.omicshare.com/forum/thread-260-1-12.html


    图1 没有显著位点的全基因组关联分析结果


    面对这些没有显著位点的结果,如果我们一味降低检验的阈值,将会引入大量假阳性。那么,我们该如何改善这个问题呢。主要有以下几种改良的方法:


    1. 扩大样本量

    统计学其实是一种数字游戏。在相同的效应水平下,随着样本量的提高,检验的自由度会提高,得到的P值也会更显著。像人类复杂疾病致病基因位点,要么在人群中非常稀有,要么效应非常微弱,只能依赖于大样本量检测才能得到显著的结果。

    这也解释了人类复杂疾病关联分析动则上万例的样本量。但对对动植物关联分析来说,大多研究的性状都是普通的性状,基因频率在群体中较高,所以检测难度相对较低,往往几百例样本就有较好的效果。





    图2 基迪奥讲座PPT——人类复杂疾病的关联分析到底需要多少样本才不嫌多?


    2. 多阶段法关联分析

    但我们做一件事情容易犯错的时候,做好就是多做几次,不断去验证之前的结果。如果单次关联分析得不到统计学意义上显著关联的位点,则可以降低阈值标准。虽然如此将降低结果的可靠性,但只要其显著性在后续的独立群体中可以被重复验证,那么结果也是可靠的。


    图3 多阶段关联分析示意图


    在医学研究中,强调结果的可靠性,更是要求位点必须是可以被重复验证的。例如,之前我们解读过的基迪奥合作客户文章《N种策略组合才能填上GWAS分析中的最大坑》,就详细解析过这样的过程(http://www.omicshare.com/forum/thread-2068-1-12.html)。


    图4 氯吡格雷代谢位点的三阶段关联分析


    3. 更有效的统计学方法

    多重检验校正的一个特点就是检验次数越多,校正越严厉。随着重测序类技术的广泛应用,标记密度不断提高,也意味着检验严厉度不断提高。那么,有一种很好的思路就是以基因(gene based)或代谢通路(pathway based)为单位进行关联分析,既可以提高统计信号的强度,又可以降低检验的次数,从而提高检测的功效[1]。这一块的方法也多种多样,我们后续可能需要开专题的讲解。

    4. 优化表型鉴定的体系

    复杂疾病或数量性状之所以难研究,那是因为表型是由基因型和环境效应决定的。如果环境变化大而不受控,本身会对结果产生很大干扰。另外,如果表型鉴定误差较大,也将直接降低检验的显著性。


    图5 表型是由基因型和环境两大因素决定的


    在表型鉴定上,多采用自动化的表型鉴定体系,可以有效降低人工检测度数的误差。近几年越来越火的表型组就是解决表型鉴定自动化的问题。另外,从DNA分子到表型,本身中间要经历大量路径,任何一个路径都受各种条件因素的干扰,也是降低显著性的一个因素。

    图6 从DNA分子到表型要经历千山万水


    根据相关性的传递原理,直接相关向间接相关的传递过程中,相关系数趋向于变弱。当A与B、B与C的相关性均等位0.9时,则A与C之间的相关性预期均值为0.81,变异范围为[0.62~1]。当A与B、B与C的相关性均等位0.7时,则A与C之间的相关性预期均值为0.49,变异范围为[-0.02~1]。(注意到只要相关性在0.7的水平,单次传递后就可能衰减为零)。  

    图7 生物体的相关性传递问题


    所以,当我们要研究两个指标的因果关系的时候,如果它们相关作用方式越临近,中间因素越少,就越容易检测到更强的相关性。所以就应用而生了以DNA分子和外在高阶表型之间的中间分子作为分子表型(molecular phenotype)开展关联分析的策略。

    以代谢组为例,代谢组往下游可以与表型开展相关分析,找到与表型相关的代谢物分子,这些分子标记物就可以成为代表外在表型的间接表型。作为间接表型,代谢分子往上游又可以与DNA分子开展关联分析(metabolome GWAS),找到调控重要代谢物变化的DNA突变。

    因此,代谢组可以作为一个很好的桥梁,提高传统关联分析的显著性。而且代谢组本身又是一种分子,也可以让关联分析的结果更具有生物学意义。这方面的内容,我们在下期文章再详细介绍。

    今天的内容就到这里啦~
    作者:周老师

    拓展阅读:

    突变是否影响个体的适应性?
    聊一聊 QTL 定位的原理
    如何选择亲本和作图群体类型?
    对全基因组关联分析(GWAS)的一些个人理解


    参考文献:
    Wang K, Li M, Hakonarson H. Analysingbiological pathways in genome-wide association studies[J]. Nature ReviewsGenetics, 2010, 11(12): 843-854.



    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2019.1.5 14:40
  • 签到天数: 306 天

    连续签到: 1 天

    [LV.8]以坛为家I

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    783
    积分
    281
    注册时间
    2017.5.15
    在线时间
    71 小时

    发表于 2018.1.19 22:52:53 来自手机 | 显示全部楼层
    谢谢分享
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    前天 13:36
  • 签到天数: 865 天

    连续签到: 12 天

    [LV.10]以坛为家III

    中华鲟

    Rank: 5Rank: 5

    主题
    15
    奥币
    2912
    积分
    804
    注册时间
    2016.7.20
    在线时间
    417 小时

    发表于 2018.1.20 22:17:17 | 显示全部楼层
    给莫北大神点赞
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2019.7.16 19:36
  • 签到天数: 170 天

    连续签到: 1 天

    [LV.7]常住居民III

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    191
    奥币
    4244
    积分
    2732
    注册时间
    2017.7.3
    在线时间
    403 小时

    活跃会员荣誉管理


     楼主| 发表于 2018.1.22 09:30:43 | 显示全部楼层

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    吃饭
    2019.2.17 14:38
  • 签到天数: 302 天

    连续签到: 1 天

    [LV.8]以坛为家I

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    396
    积分
    196
    注册时间
    2016.9.6
    在线时间
    114 小时

    发表于 2018.1.24 10:28:56 | 显示全部楼层
    切中要害 很棒的总结,看了后受益很多呀!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    2018.5.23 09:16
  • 签到天数: 29 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    202
    积分
    88
    注册时间
    2017.7.17
    在线时间
    14 小时

    发表于 2018.3.24 11:13:00 | 显示全部楼层
    谢谢分享
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    前天 19:36
  • 签到天数: 892 天

    连续签到: 4 天

    [LV.10]以坛为家III

    中华鲟

    Rank: 5Rank: 5

    主题
    0
    奥币
    3091
    积分
    578
    注册时间
    2016.5.16
    在线时间
    203 小时

    发表于 2018.4.4 10:33:33 | 显示全部楼层
    感谢分享
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表