查看: 810|回复: 3

[动植物重测序] GWAS与其他组学的贯穿分析

[复制链接]
  • TA的每日心情
    害羞
    前天 09:17
  • 签到天数: 152 天

    连续签到: 1 天

    [LV.7]常住居民III

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    170
    奥币
    3552
    积分
    2312
    注册时间
    2017.7.3
    在线时间
    314 小时

    活跃会员荣誉管理


    发表于 2018.1.30 14:12:19 | 显示全部楼层 |阅读模式
    传统的全基因组关联分析,是直接阐述DNA与外在表型间的关联。但这一方法也存在一些不足。

    传统GWAS的不足


    1.难以确定具体功能突变


    由于连锁不平衡的作用,与特点性状关联的区域往往具有较大的宽度,从而难以确定具体功能突变。如下图[1],氯吡格雷GWAS分析的结果咋一看是个细峰,实际放大后你会发现这个峰具有1.5Mb的宽度。峰的区域内涵盖了CYP2C18- CYP2C19-CYP2C9- CYP2C8 4个基因的基因簇。仅仅凭关联分析的结果,我们可能还无法确定候选目标基因以及目标突变。   


                         

    图1 心血管药物氯吡格雷代谢机制关联分析的结果


    2.难以解析DNA突变如何影响性状的具体机制


    因为从DNA到高阶表型之间还有大量的中间调控机制,突变如何影响性状还有很多可能性。尤其大部分GWAS得到的显著关联区域位于非编码区的情况下,如果没有找到非编码区调控的具体中间分子,解析其调控机制将会非常困难。


    3.有些高阶表型难以定性定量


    某些外在高阶表型,定性定量难度大,给大样本的表型鉴定的时候带来困难。例如,水果的风味鉴定。


    贯穿分析的优点


    实际上从DNA分子到影响外在表型之间,要经历表观组、转录组、蛋白组、代谢组等多个路径。在传统GWAS的基础上,加入解析DNA突变与潜在对性状有影响的中间分子(例如mRNA表达量)间的关系,将可以解决以上的问题。其主要体现在:


    1.数据解析的维度增加


    由于加入了中间性状,数据的解析从单线(仅仅DNA-表型的关系)升级为多维度(基因型-中间分子,中间分子-表型),这有助于在传统GWAS分析的基础上缩小候选基因的范围。


    2.多维度的数据结果


    多维度的数据,也为解析基因突变影响具体高阶表型的内在机制提供了可能。


    3.分子表型定量更准确高效


    处于中间的分子表型,相比外在的抽象的高阶表型(例如,抗病性、风味、性状等)更容易被高效、准确地定量,从而减少误差,有利于统计学上得到更显著的结果。


    而且根据上个小节提到的相关性传递原理,相比高阶表型,中间分子表型离DNA基因型更近,也进一步有利于得到更显著的关联结果。


    所以,针对以各种各样的中间分子表型开展关联分析,也成为了近年来关联的研究热点——xGWAS。如图2,如果以转录组为中间表型,开展基因表达与基因型的关联分析,找到的控制基因表达的染色体位点,就被称为expression QTL(eQTL)。


    如果这个中间表型是DNA甲基化,就被称为methylation QTL(mQTL);如果这个中间表型是代谢组,则可以称为metabolite QLT(也是mQTL,好像有重名啦哈,还是慎用简称的好  )。



    图2 整合多种类型的组学数据解析基因型-表型间的关联


    以eQTL类的研究为例,有时候可以帮助我们解析看似难以解释的非编码区调控现象。例如,在人类的GWAS研究中,位于基因CELSR2 的3’UTR区的若干个SNP与血清低密度脂蛋白胆固醇(LDL-C)相关,是与心肌梗死(MI)相关的风险位点。


    如果按照一般的逻辑理解,我们或许会以为是3’UTR区的突变,影响了miRNA的调控,从而影响CELSR2的翻译,最终导致疾病。但通过eQTL分析以及后续的多群体重复验证,研究人员发现表达量与这个区域的突变最相关的基因不是CELSR2,而是位于这个3’UTR区40k下游的SORT1。


    虽然最显著相关的SNP rs12740374看似位于基因CELSR2内,但这个位点缺失转录因子C/EBP的结合位点。这个位置的突变,直接影响了其下游40k处的SORT1的表达(中间隔了两个编码基因,居然还能调控到,应该是染色体的三维结构有关),从而影响LDL-C的代谢。这么骨络清奇的发现,自然在当年也发表在《nature》上[2]。类似这样的发现,为我们解析编码区突变的潜在机制,提供了不少启发。



    图3  3’UTR区的突变影响转录因子结合,从而调控下游基因表达


    再例如,代谢组就往往可以被作为代表外在高阶表型的标记物。在西红柿风味研究的的文章中[3],作者就是先通过代谢物和风味的关联分析,找到决定西红柿风味的物质是糖类、有机酸和挥发性物质。然后再以这些影响风味代谢分子作为分子表型,与DNA水平开展关联分析,找到调控这些分子的决定基因。这项研究有两大亮点:


    a)将难以量化、难以大规模高效鉴定的“风味”转为简单、容易量化评估的分子代谢物,有利于后续育种应用过程中开展大规模检测;

    b) 将抽象的风味概念,转为为直观解释的影响风味的代谢物(糖类、有机酸等),更便于从分子水平解析果实风味变化的机制。




    图4 西红柿风味的研究思路


    具体的这篇文章解读见《science文章解读:mGWAS+mQTL 研究番茄遗传机制》。


    随着测序价格不断下降,类似这样有趣又能解决问题的xQTL研究,一定会越来越多。那么,在解析突变如何影响性状这个问题上,就会有越来越多的思路。

    今天的内容就到这里啦~


    拓展阅读







    参考文献

    [1]Shuldiner A R, O’Connell J R, Bliden K P, etal. Association of cytochrome P450 2C19 genotype with the antiplatelet effectand clinical efficacy of clopidogrel therapy[J]. Jama, 2009, 302(8): 849-857.
    [2]Musunuru K, Strong A, Frank-Kamenetsky M, etal. From noncoding variant to phenotype via SORT1 at the 1p13 cholesterollocus[J]. Nature, 2010, 466(7307): 714-719.
    [3] Tieman D, Zhu G, Resende M F R, et al. Achemical genetic roadmap to improved tomato flavor[J]. Science, 2017,355(6323): 391-394.

    作者:基迪奥 周老师

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复

    使用道具 举报

  • TA的每日心情
    忙~
    2018.10.9 08:32
  • 签到天数: 651 天

    连续签到: 1 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    0
    奥币
    2385
    积分
    1109
    注册时间
    2016.1.15
    在线时间
    248 小时

    活跃会员


    发表于 2018.2.1 10:10:24 | 显示全部楼层
    收藏下,谢谢分享!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    昨天 19:18
  • 签到天数: 631 天

    连续签到: 4 天

    [LV.9]以坛为家II

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    2214
    积分
    421
    注册时间
    2016.5.16
    在线时间
    140 小时

    发表于 2018.4.4 10:31:16 | 显示全部楼层
    感谢分享
    回复

    使用道具 举报

  • TA的每日心情

    2017.10.17 19:43
  • 签到天数: 1 天

    连续签到: 1 天

    [LV.1]初来乍到

    草履虫

    Rank: 2

    主题
    0
    奥币
    81
    积分
    9
    注册时间
    2017.8.1
    在线时间
    3 小时

    发表于 7 天前 | 显示全部楼层
    收藏,感谢分享
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表