马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
近年来,单细胞转录组技术在多个研究领域都发挥了重要的推进作用,揭示了组织中微量的细胞类型和基因表达特征。
但是,细胞所包含的不仅仅是转录本,而是一个由DNA、RNA和蛋白质组成的,依循中心法则运行的有机整体;单细胞转录组的研究对象制约了研究深度的加深,单一的转录本研究不能全面体现生命进程的变化。因此,多组学联合分析成为解析生命进程的有力工具。
图1 单细胞多组学研究示意图[1]
在中心法则中,RNA处于重要的中央枢纽地位。相应地,以mRNA为研究对象的单细胞转录组在多组学联合分析中也起着重要的纽带功能。以单细胞转录组为中心的多组学联合分析有利于更好地理解基因变化与表型变化之间的关联性。
今天,我们就和大家分享部分多组学联合的研究思路。
1、单细胞转录组+普通转录组
单细胞转录组(scRNA-seq)的初心是解决普通转录组(bulk-seq)的平均化效应,但是相对成本较高,同时测序深度较低;普通转录组虽然掩盖了部分表达特征,但是相对成本较低,技术成熟度高。所以,两个组学虽然同为转录组学研究,但是样本解析层面和数据完成度存在差异且具有很强的互补性。
这两个组学可以归属为转录组学的两个分支,所以,它们的联合分析是以验证性为主。
scRNA-seq的测序深度较低,虽然其数据可靠性也很高(点击这里阅读详细文章),但是bulk-seq的数据可信度往往更深入人心。在完成scRNA-seq的特征基因筛选后,增加bulk-seq数据做验证性解释,有利于增加scRNA-seq的可信度。
2018年,D. Lambrechts等关于肺癌的分子marker研究借助了TCGA数据库的癌症转录组数据验证了scRNA-seq数据得到的正常组织、鳞状细胞癌和腺癌的特征基因。[2]
图2 bulk-seq验证scRNA-seq的思路(上)和文章数据验证(下)
bulk-seq的数据因为平均化效应而缺少了对组织中细微细胞的分析,而scRNA-seq的去平均化效应对深化bulk-seq研究有重要意义:
(1)借助scRNA-seq探索bulk-seq差异基因的细胞分布情况,进一步研究关键效应群体;2017年,S. Schafer等借助scRNA-seq发掘了IL-11在心脏成纤维细胞的高表达并促使了心血管的纤维化,为解决心血管纤维化提供了新的解决思路[3]。
(2)在bulk-seq研究的基础上,借助scRNA-seq探索差异基因对组织细胞构成的深入影响;2017年,K. S. Yan等通过bulk-seq建立了Lgr5介导的Wnt信号通路引起的小肠隐窝干细胞自我更新机制,并在Lgr5敲除、Wnt封闭体系的小肠隐窝中得到了干细胞更新和分化阻断的细胞群变化[4]。
图3 scRNA-seq验证bulk-seq的思路及文章结果
2、单细胞转录组+空间转录组
scRNA-seq在bulk-seq的基础上完成了重大突破,却依然没有实现细胞的原位分析;此前,很多研究者就希望以数学算法完成scRNA-seq的空间序列分析。直至近两年空间转录组(ST)的出现才有了填补这方面的空白信息。(点击这里获取更多空间转录组技术信息)
ST借助组织切片和分子标签技术实现了对组织转录本的原位捕获,但没有达到单细胞级的分辨率;scRNA-seq具有单细胞级的分辨率,但缺乏细胞的原位位置信息。所以,在ST出现后,这两个组学自然而然地被联合使用,用以获取高分辨率的组织空间表达图谱,完成组织空间异质性分析。
两组学联合的核心思想是解析ST中每个原位位置的细胞组成,以同时达到还原单细胞空间位置和提高图谱分辨率的目的。基于高分辨率的图谱,我们可以完成胞间联系、基因空间连续变化信息,将关键基因同时赋予细胞分布信息和组织分布信息,甚至是时间分布信息。
这样的结果更有利于我们去理解真正的生命进程变化。
图4 scRNA-seq与ST组学关联思路
围绕这个核心思想,文章的实现方式也各有不同。
2019年,S. Maniatis等以基因为分析对象,通过空间表达特征将基因模块化,进一步利用scRNA-seq数据分析基因在不同细胞类型的分布情况,以细胞类型来将基因模块进行子模块化,这样获得的关键基因解释了在渐冻症的病灶是由何种细胞通过何种调控途径引发疾病发生过程[5];
同年,M. Asp等结合ST、scRNA-seq和smFISH,直接解析了心脏的高分辨率图谱,并通过时序样本的实验设计获得了心脏发育过程中的神经塑造和心肌分化过程[6]。
2020年,R. Moncada等提出了一种富集的思想,以scRNA-seq的细胞基因表达为数据库,分析不同空间区域的细胞类型富集情况,解析了胰腺导管癌的细胞癌变途径[7]。 图5 文献结果:A) S. Maniatis等实现的模块化基因;B) M. Asp等绘制的心脏高分辨率图谱;C) R. Moncada等绘制的空间区域富集显著性热图
ST是这两年新兴的组学技术,研究者对它的理解应用还处于较初级的水平。即使如此,我们也看到了ST和scRNA-seq的联合应用空间。
伴随着ST技术的发展,数据利用率的提高,两组学的关联点也会逐渐增多;甚至两组学的关联就是推动ST技术发展的重要原动力。
3、单细胞转录组+单细胞ATAC-seq
前面提到的两个组学联合方式是对细胞转录本的深入探索;而以中心法则为依据的多层面组学探索往往是组学联合的研究方向。
近几年,和单细胞共同兴起的还有研究染色质开放性的ATAC-seq;依靠Tn5转座酶的ATAC-seq具有和单细胞技术的良好结合性——单细胞ATAC-seq(scATAC-seq)。
scATAC-seq的研究对象是染色质,scRNA-seq的研究对象是mRNA,而染色质开放性在很大程度上决定了基因表达丰度。scATAC-seq和scRNA-seq的组学联合分析有利于构建DNA到RNA再到表型的调控网络,寻找与表型相关性强的核心调控因子。
图6 scATAC-seq与scRNA-seq的关联性
两组学贯穿是依靠相同细胞类型的上调基因和上调peak完成的。scRNA-seq揭示了TF与mRNA的潜在调控关系,scATAC-seq揭示了TF在染色质的可结合性,以TF为中心点的染色质开放性、基因网络建立了挖掘核心调控TF挖掘的基础。图7 scATAC-seq与scRNA-seq关联分析思路
这种分析思路在2018年被B. B. Lake等进行了系统性应用。
作者首先利用染色质开放性和基因表达的潜在联系建立了两组学的细胞亚群映射关系,如此,对scRNA-seq进行拟时分析获得过渡态细胞也可以在scATAC-seq寻找到对应关系;对过渡态细胞的基因表达和染色质开放性研究揭示了TCF4是少突胶质细胞前体(OPC)向少突胶质细胞(Oli)分化过程中的核心调控因子[8]。
其实,ATAC-seq和RNA-seq无论在普通组学还是单细胞组学都有广泛的联合分析文章,这也让我们看到了组学贯穿带来的高效可利用性。
10X Genomics也预计在今年下半年发布在同一细胞中完成ATAC-seq和RNA-seq的解决方案,我相信这两个组学的关联分析在未来依然有很大的发展前景。
在这里,我们介绍了三种组学关联分析的思路,但是这并不是全部。其他单细胞组学——诸如单细胞CNV、单细胞甲基化、单细胞蛋白组——也在迅猛发展中,未来单细胞多组学还有很大的发展空间。单细胞多组学的发展潜力和解析维度也是其被nature methods评选为2019年度技术的重要原因。
单细胞多组学是一个个性化很强的分析内容,基迪奥有着丰富的单细胞转录组项目经验,在个性化分析服务方面有着良好口碑。对单细胞多组学感兴趣的老师可以加入基迪奥Omicsmart单细胞交流群与更多人一起探讨单细胞研究中遇到的问题。
[1] Efremova M, Teichmann SA. Computationalmethods for single-cell omics across modalities. Nature Methods, 2020. 17(1):14-17. [2] Lambrechts D, Wauters E, Boeckx B, and etal. Phenotype molding of stromal cells in the lung tumor microenvironment. NatureMedicine, 2018. 24(8):1277-1289. [3] Schafer S, Viswanathan S, Widjaja AAand et al. IL-11 is a crucial determinant of cardiovascular fibrosis. Nature,2017. 552(7683):110-115. [4] Yan KS, Janda CY, Chang J and et al.Non-equivalence of Wnt and R-spondin ligands during Lgr5+ intestinalstem-cell self-renewal. Nature, 2017. 545(7653):238-242. [5] Maniatis S, Äijö T, Vickovic S and etal. Spatiotemporal dynamics of molecular pathology in amyotrophic lateralsclerosis. Science, 2019. 364(6435):89-93. [6] Asp M, Giacomello S, Larsson L and etal. A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of theDeveloping Human Heart. Cell, 2019. 179(7):1647-1660.e19. [7] Moncada R, Barkley D, Wagner F and etal. Integrating microarray-based spatial transcriptomics and single-cellRNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. NatureBiotechnology, 2020. 38(3):333-342. [8] Lake BB, Chen S, Sos BC and et al.Integrative single-cell analysis of transcriptional and epigenetic states inthe human adult brain. Nature Biotechnology, 2018. 36(1):70-80.
本文作者:基迪奥-L.L
来源: 单细胞多组学研究思路 |