查看: 10838|回复: 5

聊一聊10X genomics的技术发展史

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
161
注册时间
2019.7.8
在线时间
243 小时

发表于 2020.5.6 10:10:20 | 显示全部楼层 |阅读模式
对于基础科研领域来说,如果有高通量单细胞检测需要,10X genomics技术是比较好的选择之一。因为该技术的发展线似乎就是围绕基础科研的各个组学单细胞研究展开的(如下图)。我们先以时间线来了解下其中的部分产品:

图 1 10X genomics技术的发展时间线

文章篇幅有限,今天我们就来聊聊从2015年到2018年10X genomics的发展历程。

2015 Linked Reads测序

最早2015年,10X genomics技术实际是开发用构建基因组大片段linked reads文库,用于辅助基因组组装拼接的。但基因组组装毕竟是小众需求,所以很多人可能对这个应用不一定熟悉。

这一年10X genomics终于将它的技术应用范围拓展到了单细胞测序领域——单细胞转录组。这个产品是目前大家最为熟悉的,也是本文重点介绍的。要值得注意的是,10X genomics单细胞转录组并非测mRNA全长,而是通过测mRNA 3’端或者5’端实现定量。这里本质的逻辑就是我们对mRNA进行定量,只需要测定RNA分子的条数。那么测一段和测全长是等效的,显然只测其中的一段更简单更高性价比的策略。当然,因为只测mRNA分子的3‘端或者5’端,自然就无法开展可变剪切分析了。

如下图,展示了3‘转录组和5‘转录组不同的磁珠结构。3’转录组磁珠的探针末端是ployT序列,可以与mRNA的ployA结合,从而实现对mRNA的结合捕获和扩增。在cDNA被酶切打断后,将只对cDNA的3’端进行后续测序。

图2 3’转录组和5‘转录组对应的两种不同磁珠

5‘转录组磁珠的探针也有类似的结构,但探针的末端则是GGG序列。由于mRNA的5’端并没有特异性序列,不能直接与磁珠结合。只能通过反转录mRNA(一样需要基于mRNA的ployT结构进行mRNA全长反转录)的全长序列,并在cDNA的5’末端加入CCC序列。磁珠探针末端的GGG序列可以与cDNA 5’末端的CCC互补结合,从而实现对cDNA的捕获。在酶切打断后,与探针序列一起被建库测序的序列将是cDNA的5’端。因此这个技术被称为5‘转录组测序。

比较而言,3’转录组直接利用了mRNA末端具有ployA序列的特性,实验过程更加简单直接。所以,仅仅进行单细胞转录组定量的话,毫无疑问3‘转录组是比5‘转录组更好的选择。那么5’转录组存在的价值是什么呢?就是下来要介绍的10X genomics单细胞免疫组库。

2017 单细胞免疫组库(V(D)J-seq)

技术原理

单细胞免疫组库,是10X genomics推出的第二个单细胞产品。免疫细胞包括B淋巴细胞、T淋巴细胞、自然杀伤细胞和树突状细胞等,其中T、B 淋巴细胞为机体最重要的免疫细胞,能根据不同的抗原结构产生不同的抗体来对抗病原体(抗原)的入侵,其数量及功能的改变反映机体免疫能力。

抗原的识别依赖于B细胞表面受体(B cell receptor ,BCR)和T细胞表面受体(T cell receptor,TCR)。TCR/BCR按照保守程度分为可变区(Variable regions, V区)和恒定区(Constant regions,C区),V区又由variable (V), diversity (D), joining (J)三类基因片段重组连接构成,且V/D/J 这3类基因片段都有大量冗余的的片段,因此可以通过重组产生丰富的TCR/BCR序列组合。

以IGH的编码基因(即免疫球蛋白重链,属于BCR的组成成分)为例,其V基因片段有约65种片段,D基因片段有27种片段,J基因片段有6种片段。在B细胞发育过程中,可以分别任意从这些V/D/J区域各选择其中一种片段进行组合,从而重组表达出一种全新的IGH。仅仅通过重组,理论上B细胞就可以表达75x27x6=12,150种组合。

另外,V/D/J基因片段重组连接的过程中,在连接区又可以通过删除和插入产生新的变异。这些V/D/J片段重组连接的区域,具有最高的多样性。这个区域是TCR/BCR蛋白结构中直接与抗原结合的区域,在抗原识别中起关键作用,这个区域又被称为互补决定3区(Complementary Determining Region, CDR3)。

图3 B细胞 BCR重链序列组成示意图

小结下,BCR/TCR可以产生多样性的方式包括:
(1)不同VDJ 基因片段组合的多样化(上文提到过);
(2)不同基因片段连接时随机插入删除造成连接的多样化(上文也提过);
(3)B细胞发育分化过程中,BCR特有的随机高频体细胞突变。
(4)BCR/TCR双链结构的组合多样化:B细胞不同重链和轻链组合的多样化;T细胞的TCRα,TCRβ,TCRγ和TCRδ组合多样化;

这些机制理论可以分别产生至少1014 种的B细胞和1018T细胞。因此,B细胞和T细胞是人体内多样性最高的细胞之一。单凭单细胞转录组测序将这些细胞分为十来个子亚群并不能反映它们的全部多样性构成,还需要直接对它们的TCR/BCR序列进行测序,才能对它们潜在功能进行更直接彻底的解析。

对人体中TCR/ BCR开展测序,从而研究人体免疫过程中的TCR/BCR变化被称为免疫组库。过去,免疫组库的研究同样仅仅落脚于组织水平,即一般是通过多重PCR对TCR/BCR V区进行扩增和测序。但这样的策略,实际上只能研究组织中整体的T细胞/B细胞受体的变化,无法精确到细胞水平对组织中BCR/TCR多样性开展研究。而V区位于BCR/TCR编码基因转录本的5’端,本身BCR/TCR基因表达的mRNA就是转录组的一部分,所以10X genomics 5‘转录组结束略微修改就可以用于单细胞免疫组库研究。

因此,10X genomics公司在单细胞转录组后,紧接着推出单细胞免疫组库就是顺理成章的事情。其基本实验过程就是完成标准的10X genomics 5’转录组的cDNA反转录组后,将cDNA一样一分为二:

(1)第一份可以继续构建转录组文库,获得样本单细胞水平的转录组信息,(2)第二份,使用针对TCR/BCR保守区域设计的引物进行扩增,异性性富集cDNA中TCR/BCR的V区序列,然后同样建库测序,获得样本单细胞水平的免疫组信息。

应用价值

大部分开展研究的组织单细胞样本中,T细胞或者B细胞往往占有相当大的比例。如果你的研究课题与免疫相关,很显然样本中的T细胞和B细胞就非常值得进一步深入研究,其中免疫组就是一个非常值得深入的方向。对于这样的课题,对样本开展10X genomics免疫组库研究,可以实现一份实验两套数据(分别检测5’转录组和免疫组测序),是性价比非常高的方式。所以,10X genomics V(D)J测序也非常受欢迎。

单细胞测序必要性的基础是对应组学在机体各个细胞中不同。例如,转录组、免疫组、表观组等在每个细胞水平都不同,都适合开展单细胞研究。在机体的正常细胞中,各个细胞的DNA理论上都是完全一致,所以没有进行单细胞测序太大的必要。唯一例外的一类细胞是肿瘤细胞。肿瘤细胞可以快速发生大量随机突变,从而实现快速演化。因此对于肿瘤细胞,开展DNA水平的重测序,从DNA水平开展肿瘤异质性研究一直是肿瘤研究的重要方向。

目前,单细胞DNA研究大部分还是基于分离单个肿瘤细胞然后开展全基因组扩增测序的方法。2018年,10X公司也推出了基于他们体系的10X genomics DNA-seq。其实整体实验的原理过程和单细胞转录组差异并不是很大,只不过将测序目标从mRNA转换为DNA。

但值得注意的是,这里的DNA-seq实际上主要分析目标是大小是200kb以上的CNV(拷贝数变异)。这主要是目前测序价格还非常昂贵,而基因组测序很显然成本大大超过转录组测序(人类基因组为例,基因组大小大概是3000Mb,而可转录的编码基因区大概是几十Mb,两者差了几十倍)。

10X genomics每次可以检测上千个细胞,考虑到成本的因素,进行大量单细胞DNA测序的时候,每个细胞所检测的数据量非常有限(相对巨大的人类基因组而言,数据很少)。由于数据量有限,其精度不足以开展SNP、indel这类小型突变的检测,只能开展大于200kb的CNV这种大型突变的检测。不过,CNV突变也是肿瘤细胞非常重要的突变方式,因此单细胞CNV-seq依然可以为我们提供很多单细胞DNA水平的肿瘤变异信息。

2018 V3版本的单细胞转录组测序

V3版本的转录组测序并非一个独立的产品,而是对V2版本的升级,主要体现为对磁珠以及反应体系进行了优化。V3版的产品主要优势是:
1)检测敏感度提高,可以检测更多基因;
2)在V3版本转录组的基础上发展出了Feature barcode等衍生产品。

2018 Feature barcode技术用于细胞表面蛋白检测

技术原理

虽然单细胞转录组可以基于基因转录表达的信息对细胞进行分类和鉴定。但mRNA转录和真实的蛋白翻译之间还有一定的距离。某些高度相似的细胞在转录水平可能无法清晰划分,但在蛋白水平则可能有更好的分类效果。

在传统的方法中,细胞表面蛋白的检测是细胞类型鉴定划分非常重要的指标。比如传统的流式细胞技术,就是利用各种荧光基团与抗体进行融合作为标签,抗体与细胞表面蛋白结合后,然后通过荧光类型就可以判断细胞的表面蛋白类型,从而实现对细胞进行分类和鉴定。

既然荧光基团可以作为抗体标签,那么核酸序列也可以作为抗体标签用于细胞表面蛋白的鉴定。10X genomics feature barcode技术就是基于这样的思想对细胞表面蛋白进行检测的。

10X genomics feature barcode细胞表面蛋白检查技术,由两个核心的成分构成:

(1)定制化的抗体/抗原(下图a)在定制的特定抗体或者抗原末端,连上一段特定的核酸探针,探针上有特征序列(Feature Barcode)以保证后续只要获得序列信息,就可以判断与细胞结合的是哪种抗体/抗原。探针上还设计有Capture sequence可以与磁珠结合。

(2)可以捕获核酸探针序列的磁珠(下图b)在10X genomics V3版本的磁珠上,除了有一段用于捕获mRNA的探针序列(下图b中的最上方的浅色的探针),还添加了可以与Feature Barcode末端的Capture sequence结合的探针(下图b中的Capture seq1和capture2)。

图4 Feature barcode以及对应磁珠示意图

有了以上两个组件,可以可以实现在同一个3’单细胞转录组测序中实现同时鉴定细胞表面蛋白和细胞内的转录组了。其基本过程如下:

(1)根据研究需要,提前选择好若干种类抗体/抗原的组合,这些定制化抗体/抗原都以及连上了特定的Feature barcode。备注:这些定制化的抗原抗体组合可以在biolegend公司购买(www.biolegend.com)。
(2)先让单细胞悬液与特定的抗体/抗原一起孵育,让抗体/抗原与细胞充分结合。
(3)对孵育后的单细胞悬液开展10X genomics单细胞3’转录组测序,就可以同时鉴定各个细胞的转录组和细胞表面蛋白类型了。

需要补充的是,由于转录组mRNA和feature barcode长度不同,所以两类cDNA需要各自单独构建测序文库,分别测序。

应用价值

同时对一份单细胞进行转录组和细胞表面抗原的检测,其意义可以用下面这张图展示。下面这张图的聚类分群结果是基于这些细胞的转录组表达信息构建的。在图中红框的部分,在转录组水平上聚类为一个簇而难以分开。红框中的细胞可以很容易被定义为T细胞,但如果再进一步细分有可能会越到一些困难,因为不同类型T细胞转录表达的基因高度相似,在转录水平往往留下很多模棱两可的中间地带。但如果同时进行了细胞表面蛋白检测,就很容易基于CD3、CD4、CD45RA/RO的信息,将这些细胞进一步细分为特定亚型的自然杀伤T细胞和记忆T细胞。

因此,细胞表面蛋白feature barcode检测与转录组检测进行结合的意义在于:
(1)细胞表面蛋白可以帮助鉴定划分在转录组水平难以区分的细胞亚型
(2)反过来,基于细胞表面蛋白对细胞在亚型水平进行更精细的区分后,我们又可以从整个转录组水平分析不同亚型的细胞间到底有哪些基因表达调控的差异。

图5 细胞表面蛋白辅助单细胞转录组分群示意图

今天的分享先到这里,下期文章我们将继续介绍目前相当火热的单细胞ATAC和空间转录组的技术内容,欢迎大家持续关注。



本文作者:基迪奥-周老师

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
0
注册时间
2017.6.6
在线时间
182 小时

灌水之王


发表于 2020.5.6 14:36:16 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2020.4.2
在线时间
3 小时

发表于 2020.5.6 15:22:30 | 显示全部楼层
学习了,谢谢
好开心啊
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2020.1.13
在线时间
8 小时

发表于 2020.5.13 12:44:07 | 显示全部楼层
学习了,谢谢
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2020.1.13
在线时间
8 小时

发表于 2020.5.26 19:50:08 | 显示全部楼层
学习了,谢谢
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
注册时间
2018.7.8
在线时间
14 小时

发表于 2020.5.28 16:49:07 | 显示全部楼层
学习了,谢谢
新的一天加油!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表