去年基迪奥参与发表了一篇全基因选择育种(Genomics Selection,以下简称GS)的方法学讨论文章(没错,我们除了RNA-seq,还会做其他组学服务dā~)。
2015年某一天,帝都,一个微信粉丝问我:“你们公司是不是只会做RNA-seq项目,其他组学的业务都不精通呢?因为你们公司的微信文章似乎从来都是围绕RNA-seq,其他组学很少涉及。”
(这是天大的误会啊!!!!!!我们不止会做RNA-seq,我们也做蛋白啊,也做16s啊,也做遗传育种啊啊啊啊啊!)
真实情况是,RNA-seq实在太好玩了,可以研究到极致。 但同时,我们也不偏科啊。所以,right now,为了证明我们在其他组学也是很拿得出手的,我们开始分享一些其他组学的技术。
在分享这篇GS文章前,我们先给大家分享一下GS技术相关的背景内容。
我们或许都听说过GWAS分析、QTL定位等这样的概念。这些是做什么呢?
其实无非就是预测哪些分子标记是与性状相关的。当然,实际情况是由于一个分子标记附近存在一个与性状相关的基因,所以导致本身没有功能的分子标记与性状间存在相关性。
如上图,由于控制株高的等位基因座Q(q)存在,周围的连锁标记A也和性状相关等位基因Q间存在关联。
如果我们可以准确预测标记的效应,那么反过来,我们就也可以利用标记来预测个体的性状。打个比方(如下表),如果我们能够完全弄清决定人类身高的基因座是哪些(L1-Ln),并准确预测出每个基因座不同等位基因的效应(L1-Ln),那么就可以建立一个线性的预测模型。理论上一个小孩刚刚出生的时候,做个基因鉴定就可以预测将来他的身高了(Genetic value)。
好,到这里,一些内行的老师估计要开始喷了!这什么玩意儿?太小儿科了吧!!
这个理论说起来容易,做起来难。我们来看看,实现这样的工作难点在哪里?
对于建立这样的一个线性模型,其预测的难点在于:
1)如何建立一个有效的预测模型? 即如何最大程度的准确预测每个QTL位点的效应,以便用于预测一个性状表型值 2)不同的模型在什么样的情况下是适用的? 3)当模型从实验室走到大田(或养殖场),到底有多大的应用价值?
|