查看: 368|回复: 1

用两篇最新的客户文章解析DAP-seq发文思路

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
739
注册时间
2020.6.16
在线时间
411 小时

发表于 2022.7.11 10:37:19 | 显示全部楼层 |阅读模式
一、DAP-seq简介

以往,我们总是通过基因水平,去揭示分化、性状、疾病等表型的差异机制,其实基因只是复杂庞大的调控网络中其中一种分子状态的呈现,而且,基于转录组的基因分析已经相当成熟,很难突破创新,因此大家不妨换种思维,瞄准转录组的上游-从转录前调控入手,挖掘是什么因素,以及如何影响着基因的差异表达。

在转录前调控中有一个至关重要的因素:转录因子(Transcription Factor,TF),对于真核生物,TF结合到基因上游特定序列的过程是转录启动的必备条件。因此,对TF结合位点的研究,可以帮助我们了解下游基因受到哪些TF的调控、靶向,为表型差异机制提供新见解。

DAP-seq就是用来研究TF的一种常用手段,其原理是体外构建表达带有磁珠的目标转录因子蛋白(TF),将TF与基因组DNA片段共同孵育,通过磁铁富集蛋白结合的片段并测序分析,可以从全基因组范围内寻找目的蛋白的DNA结合位点。此技术克服了缺少TF抗体、结合效率低的限制,将转录因子机制研究推向更广泛的应用。目前,DAP-seq还处于新技术的范畴中,比较容易发文章。

二、DAP-seq文章思路

DAP-seq的发文思路以及分析点相对于ATAC以及m6A来说是比较简单的,大多围绕转录因子展开,一般有以下两种思路:
①“基因家族研究”:对一类“基因家族研究“展开研究,来分析某类基因家族是如何通过TF来调控基因表达的;
②“物种研究”,将某个物种的TF结合位点信息全部建库检测,建立该物种TF的信息库;

两中思路各有侧重点,前者比较适用于有目标基因的开展(适合刚入门者,投入少,研究相对简单);后者适合对TF研究达到一定深度后开展(耗时,收获大)。而且大多文章中也不单单是只通过DAP-seq来干巴巴的分析,会结合多个组学,以及各种分子实验,将整个上下游调控机制串起来。

那么下面我们以基迪奥最新发表的两篇客户文章为例,为大家具体介绍DAP-sep的发文思路。

三、文献解读

—01—

特点:
思路上:采用倒叙描述,先从基因变化入手,反向推论造成基因变化的上游调控机制;
技术上:以DAP-sep为主,其他组学为辅的多组学套路。

Genomics,IF=4.310,2022.4,合作单位:中国水产科学研究院黄海水产研究所

#研究背景#

SSD(雌雄大小二型)是指同一物种雌雄身体表现出不同大小,而半滑舌鳎是一种具有典型的雌性偏SSD和雌性异配子性别决定系统(ZW/ZZ)的鱼类,其雌性(ZW)向伪雄性(ZZ)的性别逆转会显著降低雌性个体的比例,严重限制养殖业的可持续发展,因此探究半滑舌鳎偏雌性的SSD的关键调控因子至关重要。

#实验设计#

取450名雌性和59名雄性半滑舌鳎,提取基因组DNA,进行GWAS与生长性状(BL体长、BW体重)关联分析;用转录组数据绘制25种基因在不同组织(垂体、性腺、脑、肝)中的表达模式图;提取雌性脑组织基因组DNA进行DAP-seq 研究。

#分析思路#


#实验结果#

1. GWAS初步筛选——揭示与生长性状相关的基因和SNP

在前人的研究中已经通过GWAS推断出牛和马的SSD机制的潜在遗传结构,因此本研也沿用此思路先通GWAS识别性别逆转、性别分化和抗病的遗传机制。

结果表明 :BL和BW共鉴定出20个显著SNP (图1,p<10−7),这些SNP主要分布在性染色体w和z上,表型变异(PVE)范围为6.82~13.77%。为了鉴定可能涉及SSD生长性状基因或途径,将这20个SNPs上游20 kb的基因与半滑舌鳎基因组比对,得到25个基因(表1)。

图1 BL和BW的曼哈顿图和qq plot

表1显著SNP的鉴定与基因注释

2. 转录组再次筛选——zbed1等基因在雌性垂体和大脑中高表达

上一步GWAS鉴定到了一些与性状可能相关的基因,那通过转录组数据,进一步验证,在雌性组织中高表达的基因有哪些,结果发现zbed1、nsd3、campsap1b、foxn4、letm2在雌性垂体(FP)和大脑(FB)中表达最高。

图2 雌性和雄性组织中25个RNA转录本FPKM的基因热图

3. DAP-seq靶基因筛选-鉴定zbed1的靶基因

下游转录层面的基因变化已经清晰,那接下来要对上游转录因子对基因的调控机制进行探索。

为什么选zbed1转录因子作为重点研究:
基于GWAS和转录组结果,发现zbed1在垂体和大脑中表现出雌性偏向性表达,并且此前报道也发现它是果蝇和人类细胞增殖的重要转录因子。

如何分析:DAP-seq本质是围绕富集区域(peak)展开的一系列研究,比如,对peak的分布位点(内含子、外显子等区域),peak结合区域特征(motif),peak差异情况等进行分析;然后再对peak所在位置的基因进行相关注释,最后对基因进行功能特征研究。那我们看下这篇文章,针对此部分作者都采用了哪些分析点,得出了怎样的结论:

①peak在染色体以及基因功能原件上的分布情况:共鉴定出1352个peaks (q<0.05),集中分布在chr1(145)、chr14(114)和chr8(112)染色体上(图3);45.33%、21.67%和17.61%的peaks分别位于内含子、远端基因间区和启动子区(图3)。

图3 peaks在不同染色体和基因组区域的分布

②peak相关基因注释以及GO、KEGG功能分析:根据peak基因的注释,可以了解关于peak的相关基因,从一定程度可以表示目的蛋白或特定组蛋白修饰可能调控的靶基因区域。

结果:共鉴定出984个基因,进一步的GO和KEGG富集分析表明,zbed1调控的下游通路包括轴突引导和再生、 hippo信号通路、细胞周期、转译、凋亡和PI3k-Akt信号通路(图4)。并且关联网络显示pi3cd,ccnd1,tcf7l2等是zbed1调控网络的重要基因(图5)。

图4 zbed1的调控网络

图5 富集通路与关键基因相关性关系

③peak结合特征Motif分析:共有4个MEME motifs、3个DREME motifs和1个CentriMo motifs被显著识别(e<0.05),前5位的motifs序列如图5A所示。通过motif结构分析发现,MEME-1和MEME-2rc与果蝇DREF和哺乳动物ZBED1的moti具有相似的序列结构(图5B)。Motif tomtom comparison 显示,MEME-1与已知ZNF384 (MA1125.1)相似,属于c2h2类锌指因子,与DREF和ZBED1相似。综上所述,MEME-1初步确定为ZBED1在半滑舌鳎中的结合位点

图6 motif分析

结论:
这篇文章逻辑上很清晰,首先从GWAS和转录组的数据入手,对下游基因差异表达情况和功能特征进行验证;接着又通过DAP-seq补充上游转录因子结合区域,DNA层面的信息,并找到了ZBED1转录因子在半滑舌鳎SSD研究中的关键结合位点(motif),实现了由下游基因-TF-motif 的调控网络论证,对于初入DAP-seq研究领域小伙伴们来说是个不错的研究方向。

—02—

特点:
思路上:采用倒叙以及干湿逻辑穿插的方式,全面揭示转录因子的上下游调控机制;
技术上:以转录组以及分子实验(VIGS)为主,dap-seq为辅,干湿结合的套路。

Frontiers in Plant Science,IF=6.627,2022.3,合作单位:西北农林科技大学

#研究背景#

RNA沉默是真核生物中常见的抗病毒机制。然而,控制RNA沉默过程的转录调控机制仍不明确。

#实验设计#

收集感染TRV(PPK20) 的矮牵牛叶片,分三个阶段(0 dpi (S0)、3 dpi (S3)和6 dpi (S6) )进行 RNA-Seq测序(n=3);

提取叶片中的基因组DNA,在体外表达Halo-phcol4融合蛋白,两者共同孵育后进行DAP-Seq测序。

#实验思路#

图1 研究思路

#实验结果#

1. 转录组对植物激素基因、转录因子基因、RNA沉默相关基因的差异表达研究

1.1 基因初步分析(病毒感染过程中差异基因分析和功能富集分析)

首先对感染TRV(PPK20)后,基因整体表达情况进行初步描绘。差异分析显示,与S0相比,S3显示3413个上调, 1275个下调的ungenes;与S3相比,S6只有895个上调,784个下调(图2)。这能说明,病毒感染确实能导致转录谱的变化

按照转录组套路,筛选了差异基因后,接着就会借助GO、kegg等数据库进行富集分析,了解基因的功能特征。GO富集分析表明S0-S3的1581个DEGs, S0-S6的2007个, 以及S3-S6的428个DEGs分别被富集在126、127和101个生化途径。其中“内质网蛋白加工”、“植物-病原体相互作用”和“植物激素信号转导”通路显著富集。

图2 差异基因柱状图

1.2 特定基因群体分析(挑选植物激素、转录因子、RNA沉默相关基因)

①植物激素基因表达分析

在上步功能富集分析中,我们了解到矮牵牛感染TRV (PPK20)后,其DEGs在植物激素信号转导通路中显著富集;因此探讨这些植物激素基因受病毒感染的调控情况。结果表明, ET/ JA以及ABA/SA含量分别在5和6dpi时最高 (图3A)。另外,ET生物合成基因PhACO1、PhACO2、PhACO3等显著上调。ABA生物合成途径中PhZEP、PhNCED3、PhNCED5等转录,而非PhNCED7。此外,除PhLOX3外,其余参与JA生产的基因均高表达。SA生物合成基因,如PhCM1, PhADTs(1和6)和PhPALs (1, 2a和2b)上调(图3B)。

图3 TRV PPK20感染后几种植物激素的积累和生物合成基因转录

②抗病毒RNA沉默相关结构基因研究

由于RDR、DCL和AGO在抗病毒RNA沉默中很重要,因此选取它们的转录本进行分析。结果表明, PhRDR1、PhRDR2、PhRDR6、PhDCL1a、PhDCL1b、PhDCL2、PhAGO1a、PhAGO1b、PhAGO2等基因显著上调。其中PhDCL1b转录变化最高,其次是PhDCL2 (图4)。

图4 TRV (PPK20)侵染不同时期矮牛叶中RNA沉默相关转录本的表达

③转录因子基因鉴定

由于转录因子是启动转录的开关,因此对其编码基因的鉴定也是十分必要,能从侧面反映基因的转录调控机制。鉴定了469个编码转录因子的DEGs,与S0相比,S3有286个差异表达的转录因子,分别属于32个家族,204个上调,82个下调。当比较S6和S0时,共鉴定出374个(225个上调,149个下调)编码TF的DEGs(33个家族)。其中来自bHLH、bZIP、ZFP、ERF、MYB、NAC和WRKY家族的TF数量最高(图5A)。

图5 TRV PPK20感染的矮牵牛叶片中转录因子的差异表达

2. VIGS技术协助筛选抗病毒RNA沉默相关转录因子

前期通过转录组数据对病毒感染中基因的表达情况已经阐述清楚,接下来借助VIGS(病毒诱导的基因沉默)技术来确定对病毒RNA沉默起作用的关键转录调控因子。

这些TFs片段被克隆到TRV-GFP-PhPDS载体的多个克隆位点,生成重组结构(图5B)。用GFP和PhPDS作为报告基因进行病毒积累和基因沉默。与对照相比,含PhARF11、PhbHLH41、PhCOL4等片段的TRV-GFP-PhPDS构建体接种后,4 dpi荧光信号增强。相比之下PhPIF3、PhZAT10、PhERF22等插入物的荧光亮度被抑制(图6)。

图6不同转录因子VIGS沉默的矮牵牛花叶片中GFP荧光和光漂白表型的发展

3. RT-qPCR揭示PhCOL4可调节RNA沉默相关基因表达

鉴于PhCOL4沉默对GFP荧光和叶片光漂白的显着影响,因此,对PhCOL4进行进一步的功能表征。PhCOL4的沉默和短暂过表达水平显示,与TRV-GFP-PhPDS对照相比,TRV-GFPPhPDS/COL4 4dpi时,PhCOL4和一些RNA沉默相关基因(PhRDR6、PhDCL2、PhDCL4等)的转录水平下降(图8A)。与空载体对照相比,在矮牵牛花叶片中瞬时过表达PhCOL4导致这些沉默基因的转录丰度增加(图8B)。表明PhCOL4确实可调控下游RNA沉默相关基因的表达

图8 PhCOL4沉默及短暂过表达对RNA沉默相关基因的影响

4. DAP-seq分析PhCOL4的靶标基因

前期花费了很多经历,终于找到了关键的转录因子PhCOL4,接着就是对PhCOL4结合区域的靶标基因进行DAP-Seq测序分析。结果表明,许多peak位于起始位点之前(图9B)。在1626个peak中,有660个(40.59%)位于2kb上游启动子区域。其余位于5' UTR、3' UTR、外显子、内含子和下游区域(转录结束位点后2kb)(图9C)。基于MEME和DREME分析发现了两个motif,其核心元件为TTCTT(或对面链上的AAGAA)(图9D)。通过peak的功能注释,发现了两个重要的基因PhRDR6和PhAGO4参与RNA沉默通路(图9E)。

图9 矮牵牛花中PhCOL4的DAP-Seq分析

5. PhCOL4结合到PhRDR6和PhAGO4启动子

最后,验证PhCOL4是如何导致RNA沉默的。双荧光素酶实验(图10A)显示,与空载体对照相比,35S:PhCOL4与pPhRDR6:LUC或pPhAGO4:LUC共表达可显著提高LUC活性(图10B);并且PhCOL4和野生型启动子片段共转化的酵母细胞在100 mM 3-AT的选择性培养基上生长良好。而突变启动子生长受到显著抑制(图10D)。这些结果揭示了PhCOL4与PhRDR6和PhAGO4启动子之间的直接相互作用。

图10 PhCOL4对PhRDR6和PhAGO4启动子的反激活作用

结论:
这篇文章同样也是先基于转录组从下游基因的差异表达进行分析,并对不同类型的基因分别进行了阐述,也确实表明病毒对这些基因的表达具有调控作用;然后作者又通过插入TFs片段构建重组病毒,通过VIGS和RT-qPCR技术筛选到与抗病毒RNA沉默相关转录因子PhCOL4;最后基于DAP-Seq分析了PhCOL4的靶标基因--PhRDR6和PhAGO4),并结合双荧光素酶实验,揭示PhCOL4是直接结合到PhRDR6和PhAGO4启动子起作用的。本文将干湿结合进行很好的穿插验证,设计了很多分子实验,有一定的难度,具体用那种思路,小伙伴们依据自身情况而定。

参考文献

Wang N, Gao J, Liu Y, et al. Identification of crucial factors involved in Cynoglossus semilaevis sexual size dimorphism by GWAS and demonstration of zbed1 regulatory network by DAP-seq[J]. Genomics, 2022, 114(3): 110376.


Xu Y, Ji X, Xu Z, et al. Transcriptome Profiling Reveals a Petunia Transcription Factor, PhCOL4, Contributing to Antiviral RNA Silencing[J]. Frontiers in plant science, 2022, 13.


本文作者:基迪奥-潇潇

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
3
注册时间
2021.6.22
在线时间
57 小时

发表于 2022.7.14 21:28:12 | 显示全部楼层
今天也是元气满满的一天啊!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表