|
随着转录组方面的研究愈加深入,许多研究者已经不仅仅限于mRNA方面的研究,还逐步发展到其他RNA的研究,其中lncRNA是比较火热的研究对象。之前的微信文章《如何高效率进行lncRNA-mRNA相关关系研究》给大家介绍了lncRNA的调控方式和lncRNA-mRNA关联思路。今天,我就通过一篇lncRNA-mRNA综合分析的文章,给大家介绍一下lncRNA-mRNA关联分析的方法。
期刊:Journal of Advanced Research (IF = 5.054)
研究背景
腱鞘周围纤维化是肌腱损伤后常见的并发症,肌腱在纤维化的腱鞘内活动受限而引起疼痛和功能障碍的即为腱鞘炎,其特征是由于ECM合成和降解的平衡被破坏引起的细胞外基质(ECM)过度积累。这种不平衡会导致肌腱功能受损,增加术后复发的风险。
实验设计
设置对照组和腱周纤维化组,两组样品各包含三次重复。对6个样本进行转录组测序,分析mRNA和lncRNA。
Tips:
腱周纤维化组:早期纤维化腱周组织标本取自肌腱损伤后2-3周进行肌腱修复手术的患者。所有患者均发生腱周粘连。
对照组:肌腱组织样本取自急诊手术进行前臂截肢的患者。
文章框架
文章在取得两个比较组的6个样本之后,首先分别对lncRNA和mRNA进行分析,获得两部分的差异基因和lncRNA。之后对mRNA的差异基因进行富集分析,了解基因功能。最后,将目标lncRNA与差异mRNA进行关联分析,进行实验验证。
图1 文章框架
研究结果
LncRNA鉴定
在进行测序工作之前,作者先对两个比较组COL1和a-SMA的表达水平进行了检测,看早期粘连组织中是否发生了纤维化。Western blot结果显示,COL1和a-SMA蛋白在早期纤维化腱周组织中的表达高于对照组。之后作者进行转录组测序,鉴定出20646个lncRNA,这些lncRNA在每条染色体上均有分布。
Tips:
1.COL1:胶原蛋白1;a-SMA:a-平滑肌肌动蛋白(a-SMA)。这两种蛋白在发生纤维化的腱周组织中会较高表达。
2.通过链特异性建库的方式进行转录组测序,即可获得lncRNA与mRNA信息。文章开始的部分可以对lncRNA的长度、类型和染色体分析信息进行描述。
图2 COL1和a-SMA的表达情况
图3 lncRNA在染色体的分布情况
图4 每个样本的测序数据情况
差异表达分析
作者将设置差异倍数≥1.5,P值<0.05为阈值分别对mRNA(A)和lncRNA(B)进行差异分析。鉴定出219个差异表达的lncRNA和3403个差异表达mRNA,其中98个lncRNA在纤维性腱周组织上调,121个lncRNA在纤维性腱周组织下调;1704个mRNA在纤维性腱周组织上调,1699个mRNA在纤维性腱周组织下调。之后绘制热图展示lncRNA和mRNA的差异基因表达情况,直观的展示出纤维性腱周组织的lncRNA和mRNA表达水平与正常肌腱组织的存在差异。
之后使用qRT-PCR验证差异表达lncRNA和mRNA的准确性和重复性。
Tips:
1.差异分析常用的阈值设置为差异倍数差异倍数≥2,Q值<0.05。但是如果差异分析时发现差异的mRNA/lncRNA比较少,可以适当调整阈值,将差异倍数调整至1.5,Q值换成P值。同样的,如果差异的mRNA/lncRNA比较多的情况下,也可以将阈值调整的更严格,将Q值换成<0.01。
相关差异分析课程,可以观看在线课堂:《基于表达量分析的差异分析理论》。
2.差异分析之后,往往会绘制热图整体且直观的展示不同样本的lncRNA/mRNA表达情况。并且在我们获得目标基因/lncRNA之后,也可以绘制热图展示这些目标lncRNA/mRNA在不同样本的表达情况。
但是不会绘制热图怎么办?观看在线课堂《热图绘制》教您画热图。
图5 lncRNA与mRNA差异基因热图
富集分析
作者分别对上调和下调的差异基因进行GO和KEGG富集分析。
GO富集分析结果显示,上调的基因显著富集于与细胞成分分解、翻译终止、SRP依赖的膜靶点翻译蛋白等生物学过程中。下调的基因显著富集于细胞对化学刺激的反应、对有机物的反应、多细胞生物的发育等生物学过程中。
KEGG富集分析表明,上调的mRNA与35条通路相关,下调的mRNA与66条通路相关。其中显著富集的通路主要包含ECM受体相互作用、细胞周期、肿瘤坏死因子信号通路等。这些terms和通路可能与腱周组织纤维化相关。
Tips:
富集分析是转录组分析的常见内容,在得到差异基因或者获得某些目标基因之后都可以进行富集分析,看这些基因显著富集在那些通路上,之后我们可以针对这些通路进行进一步的研究。但是,要注意的是,lncRNA的分析中是不包含富集分析的,因为lncRNA是没有基因的概念的。
想进一步了解富集分析的内容,请看在线课堂:《基于富集分析的功能分析介绍》
在进行lncRNA-mRNA关联分析的研究时,我们也可以选择某些通路的差异基因与lncRNA进行关联分析。
图6 差异基因GO富集分析
图7 差异基因KEGG富集分析
LncRNA-mRNA关联分析
lncRNAs的潜在功能可以从lncRNA-mRNA共表达网络中推断出来。共表达相关系数使用皮尔逊相关系数(PCC)计算,PCC≥0.99的相关关系被认为是共表达关系,共表达关系使用网络图呈现。作者选择8个差异表达的lncRNA绘制共表达网络图。网络图中共有154个节点,其中8个为lncRNA,146个为mRNA。包含116个正相关关系对和65个负相关关系对。
Tips:
1.如何选择差异表达lncRNA和mRNA绘制网络图?可以根据文献选择目标的lncRNA与差异mRNA进行共表达分析。如果没有目标的lncRNA,则可以选择差异倍数比较大的lncRNA与差异mRNA进行共表达分析。
2.网络图常用的软件为cytoscape,如果想学习网络图的理论与绘制方法,可以观看在线课堂:
《网络图基础理论与cytoscape数据准备》
《cytoscape网络图美化技巧》
《cytoscape网络图数据挖掘技巧》
点击这里即可观看。
图8 lncRNA-mRNA共表达分析网络图
实验验证
Dnm3os 与细胞或细胞间质纤维化密切相关。从小鼠肌腱组织分离出来初代腱细胞,使用TGF-β1处理24h后,发现Dnm3os的表达水平显著升高。当细胞转染了Dnm3os siRNA,腱细胞活性明显受到抑制。
前文说过,COL1和a-SMA蛋白在早期纤维化腱周组织中的表达高于对照组。转染了Dnm3os siRNA的细胞与对照组相比,COL1和a-SMA基因的表达水平显著下降。结果表明,Dnm3os的沉默可以防止腱细胞的纤维化改变。
Tips:
Dnm3os:被称为DNM3相反链/反义RNA,是显著上调程度较大的lncRNA之一。Dnm3os缺陷小鼠表现出过氧化物酶体增殖物激活受体-δ信号的恢复,心脏收缩力的提高和间质纤维化的减少。Dnm3os siRNA则可以干扰Dnm3os的表达,使其沉默。
图8 不同处理下COL1和a-SMA的表达情况
总结
这篇文章的逻辑十分的清晰,主要包含4部分内容:
1. 通过差异分析获得差异lncRNA和mRNA;
2. 对上调和下调差异基因进行富集分析,获得与腱周纤维化相关的差异基因的具体功能;
3. lncRNA-mRNA共表达分析,获得与目标lncRNA相关的差异表达基因;
4. 最后使用少量分子实验验证结果。
从这篇5分左右的医学类lncRNA-mRNA关联文章可以看出,这种类型的文章逻辑比较套路化。文章的内容包含的均为差异分析、富集分析、共表达分析这一类常见的分析内容,再配合少量的分子实验,即可对lncRNA与mRNA的相关关系进行研究。
这种类型的文章只需要lncRNA与mRNA的测序数据和少量的分子实验,如果测序数据可配合高效率的数据挖掘工具则能在非常短的时间内完成数据分析工作,则可以大大缩短分析的周期,提高发文效率。对于想快速发出lncRNA相关文章的老师十分适用。
我们将在本周四(4月16日)的16:00进行在线直播,将这篇文章的分析思路进行逐一阐述,并现场展示如何利用OS在线工具对案例数据进行挖掘,在最短的时间内完成所有分析内容,欢迎大家准时参加。
参加方式:扫描下方二维码加入QQ群,直播将在QQ群中进行。
参考文献
Zheng W , Chen C , Chen S , et al. Integrated analysis of long non-coding RNAs and mRNAs associated with peritendinous fibrosis[J]. Journal of Advanced Research, 2018.
本文作者:基迪奥-小张张
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|