查看: 32836|回复: 95

第1期在线交流“转录组、miRNA以及两者贯穿分析”回顾

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


发表于 2015.12.29 15:31:10 | 显示全部楼层 |阅读模式
2015年5月27日 “转录组、miRNA以及两者贯穿分析”在线交流回顾

随着高通量测序技术的成熟,转录组测序为基因组学研究提供了全新的角度。比如转录组测序可以用来预测基因结构、可变剪切、SNP检测、CDS预测以及基因融合鉴定等等。从而越来越多的科研人员开始做转录组测序项目;但另一方面,在转录组测序越来越热门的同时,很多科研工作者在数据分析上也遇到了诸多问题。

为此,基迪奥生物特邀两位在转录组测序与数据解读方面非常有经验的技术工程师,在基迪奥生物信息交流QQ群与大家进行在线交流(群号:67185986),在线探讨转录组数据分析及与miRNA贯穿分析的相关问题。




本次交流PPT在此下载:

现将交流的重点内容整理如下:

Unigene与转录本

:请问下转录组测序中,组装后的unigene和转录本这两个东西该怎么理解?是一样的吗?
:本质上区别不大。triniy组装出来的视为转录本(mRNA),之后去除冗余后(比如挑最长的转录本),统一命名为unigene。Unigene视为转录本的子集。

:挑最长的转录本,自己写脚本吗?
:写程序。

:既然是子集,可否找出和子集序列相关的其他unigene
:trinity 的根据组装过程可以区分出来全部的转录本和最后的unigene的,不用后面再分子集。

:在文章中用unigene还是转录本?
:无参物种使用Unigene,有参物种使用用转录本比较好。

:无参的转录组分析组装出来的fa文件怎么得到unigene
unigene概念很宽泛,我们是取最长转录本来作为unigene

:转录组分析中新转录本和可变剪接怎么分析?
:如果是无参考的,新转录本和可变剪接的分析方法基本没有区别,如果是有参考的话,两者分析方法就不一样,前者分析功能,表达量,后者分析结构上的变化等等。
具体实现方法的目的有很多,但全部说的话会很久。我们假设一个分析目的是有参考的可变剪切,可以用asprofile来分析可变剪切的结构。





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

本帖被以下淘专辑推荐:

哈啊哈哈
回复

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 15:33:04 | 显示全部楼层
靶基因问题

:真菌中预测miRNA比较好的软件有哪些?
:我们也没有好的方法,mirBase里面都没有,目前也只有在酵母中发现极少数的miRNA

:小RNA 测序数据初步处理时PDF里给出了两种软件,cutadapt,fastx-toolkit,用哪个比较好还是两个都需要用?
:两个都可以。

:在预测新的miRNA时,你们给出的思路是先预测其二级结构再用mireap,这个是专门针对植物还是动物啊,有没有别的可以推啊?
:没有针对性,这个方法是通用的。

:miRNA测序结果怎么去掉一些其他的RNA,诸如rRNA,tRNA之类的,我看到有的文献里会展示出来?
:比对Rfam数据库,比对到的为rRNA或者tRNA,去掉即可。
:是对RFAM下载到的数据直接BLAST吗?
:是的。

:可是我用的Fastx_toolkit之中出问题,去接头的话只能去掉4%的数据,这样是不是出错了?
:不一定是软件的问题,你先看看你去完接头之后的长度分布,一般动物的峰值在22,植物在21和24,你先看下有没有问题。比如最好画个长度分布,这样验证最准确。如果接头没去干净,峰会右偏;如果接头去过头了,峰会左偏。

:你能给我看个去接头质量比较好的峰图吗?


:我看到预测新的miRNA的时候,有的是先预测出来成熟的miRNA序列在预测二级结构,例如MiRDeep-P,这个与cutadapt,fastx-toolkit比较,哪个更好一些?
:不同的文献有不同的方法,不能确定哪个方法更好,跟你的样本,试验方法等等相关。

:可是如果不知道用哪个怎么选择呢?
:基于发卡结构的新micorRNA不管用什么方法预测,假阳性都较高,不用纠结。

:预测miRNA靶基因最好的方法是多个软件预测去交集对吧,我看到也有好多文献就用一个的,这是怎么回事。不是最好多个软件么?
:植物不需要用多个软件,因为其作用方式与动物的不一样,本来靶基因就少,取交集就更少了。另外,miranda 、targetscan 等都是针对动物的,最好不要用来预测植物的。

:可是用一个的话有的miRNA会出现4-5个靶基因,到时候实验验证增大了工作量啊。那这样的话实验验证工作怎么做?
:如果你为了实验验证量小点,可以取交集,当然这样做会增加假阴性。或者可以查查文献,再选选别的取交集。

:miRNA植物预测的最好软件是什么,我看到用什么的都有。以及miRNA预测的靶基因做GO分析应该怎么做?
:没有“最好”。GO分析只有富集分析,下文有具体说明。

:怎么分析miRNA在其他物种的保守性?
:和mirbase比对。
:怎么比对呢?
:在其他物种中找些保守miRNA,自己研究的物种找些保守的miRNAblast比对就可以。
:在什么网址blast,是mibase
:推荐你一个简单的工具,mirdeep,你只要有小RNA测序数据,最后保守的novel的都会出来啊。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
哈啊哈哈
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 15:33:12 | 显示全部楼层
蛋白家族问题
:基因家族怎么分析?
:我们的做法是,先做序列比对,找出每个基因家族中保守的区域;然后进行聚类,我们用orthomcl 来进行基因家族分析。

:是不是PRAM值一样的,就是一个蛋白家族?
:这个不一定啊,蛋白家族是通过序列来做的。

:这是搜索的保守结构域的结果:


下面是 PFAm的结果


请问是一样的吗?
:位点不一样,结构域应该是一样的。
:可是这是同一条氨基酸序列比对的,同样都是保守结构域,怎么体现出位点不一样。
:这两段都是一样的结构。
:为啥名称是不一样的,这样就很容易认为是别的家族的基因啊?
:NCBI和pfam的预测算法有差异,所以结果有时候会有差异。不过你有没有查过这两个家族是什么关系?
:我不会查,不知道有没有关系,该怎么查啊?
:你搜下wiki

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
哈啊哈哈
回复 支持 2 反对 0

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 15:40:17 | 显示全部楼层
GO\KEGG富集分析
:我已经对unigene进行了nr、nt数据库的注释,接下来怎么从中挑出差异基因的注释结果进行GO富集和Pathway 分析?
R软件里面的超几何检验。

:对于无参考基因组的物种而言,用什么方法进行GO富集和Pathway 分析?
:用超几何检验的方法,在R中有包


:啊,天啊。那若不会编程语言,是不是就不能做富集分析?
:有些网站可以做,但是只能做有参考的物种。

:那无参的物种怎么办?
:无参需要先对unigene进行GO和KEGG的数据库注释,之后利用超几何检验来进行富集分析。

:转录组数据测序回来的不是已经有GOKEGG注释了吗?
:如果要一些个性分析,就需要根据具体的基因集,比如客户挑出来的基因集,来做富集分析。不过,自己来做富集分析还是需要先学习R。

GO pathway分析后结果数据太多,如何挑选比较有意义的数据进行后面的实验?
:优先挑取富集显著的,比如Q值小于0.05的通路;其次要结合你自己的生物学问题,来讲故事。

比如说我想了解咖啡碱合成的代谢通路分析,我应该怎么做?
:如果是有转录组的数据,这个应该已经有这个pathway的结果,你现在的情况是结果中没有发现关心的问题,还是跟预期不一致?
:我是想做一个关于咖啡碱合成途径的代谢通路,然后在pathway中体现出哪些基因上调或者下调。
:重新绘制通路,还是在已有的通路上绘制上下调关系?
:重新绘制。kegg网站的通路图都太庞杂,要缩小范围重新画怎么画?
:推荐你个工具pathway builder tool ,可以绘制很高大上的通路。在群共享可下载此工具。

:能不能系统的讲解一下转录组数据分析的基本思路和方法?看了很多相关的回答或是文献也还是昏的,不晓得咋入手。
:这个问题请见群文件“转录组测序技术介绍”。

:能否讲解一下KEGG富集分析,聚类分析
:这个问题是想了解具体的分析方法还是这个分析的意义?
:分析方法,聚类分析我不知道选择何种聚类算法。
:常用的层次聚类聚类方法,h-cluste

:那你如何计算你的P值和Q值呢,这是KEGG富集分析里面最重要的东西。
R直接给出来P值,(phyperQ值用FDR


这个看不懂,请问这个P和Q怎么出来的?
:富集分析本质上是检验你的第二列和第三列这两个百分比的差异是否显著,就是你的差异基因在那些通路中更多。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
哈啊哈哈
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 15:40:23 | 显示全部楼层
:请问做外遗传学瞬时效应应该做什么数据分析,是RNA-seq还是做表达谱?
:外遗传学瞬时效应,我们不了解这个……RNASeq和表达谱基本上是一样的结果。
:我看过去年CELL上的一篇文章,它的是延时效应,它比较两个不同处理的RNA变化。
:请问老师,你研究的什么内容,打算在什么物种上做研究?
:我研究的是线虫。
:传统的表达谱(SE50)技术逐渐的会被淘汰,建议你用RNA-seq
:请问信号通路图有什么软件可以画呢?
:信号通路如工具,见群共享“pathway builder tool”。
:无参和有参的具体差别在哪里,现在转录组都可以测序,但是后续分析有什么差别?
:可以参考这张流程图:
:转录组和表达谱测序中,编码酶的unigene有多个,而且有上调也有下调;这个怎么理解?UNigene都验证吗?
:这是很正常的。可能有两个原因:1)注释有假阳性;2)有可能是同一基因的多个转录本。
:无近缘基因组测序的无参转录组如何通过Qpcr验证转录组测序结果?
:你可以从组装得到转录本序列,对你感兴趣的功能序列可以设计相应的引物进行qpcr的验证。
:如何运用转录数据进行SNP分析?
:组装转录本,把reads贴回转录本,然后callsnp,然后分析它们的碱基型等等。
:有没有专门的软件进行分析?
GATKsamtoolssoapsnp
:转录组、小RNA和蛋白质组整合分析有什么比较成熟的方法么?
:两组比较一般选用差异上下调分开找交集,如果样本较多,可以考虑用相关系数,也要结合靶向预测的关系,比如miRNA和mRNA的调控,找出关键的调控途径。
:那就是只能依靠表达量之间的关系来确定?
:一般来说有1)表达量 2)靶向关系。这两个经常是一起来找。
:最后的结果能关联多少?
:不同项目可能会有区别,找到了以后其实可以做些网络调控图。如下:
                              

:那蛋白质组的数据呢?
:蛋白组可以用来判断miRNA转录后调控的结果。
:非模式物种做这个的关联效果能有多少?30%
:我们有的结果有20%,也有10%的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
哈啊哈哈
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
784 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 15:47:04 | 显示全部楼层
QPCR问题
:有了转录组数据,一般还需要做哪些验证试验?
:一般要做QPCR来验证表达量的一致性。
:用定量PCR验证miRNA表达模式跟测序分析的不同,测序的是上调,定量的是下调,这种该如何分析,什么原因?
:如果你只是挑了一个基因的话,这个情况会经常遇到,如果你确定QPCR没有问题的,那就以他为准。
:以定量结果为准么?
:如果你挑了20个基因,结果都不一致的话,那要看下测序数据的分析是否有无问题。
:我定量做了9个,只有一个和测序分析的规律一样,怎么搞?
:上下调模式还是差异倍数?
:上下调,就是我找了三个处理统一下调和上调的miRNA,定量后,只有一个符合规律。
:你的表达量有归一化处理么?
:有的。
:用的什么值,TPM
rpkm
miRNA表达量,用rpkmmiRNA的表达量不会用RPKM值。
:请问表达量的归一化怎么去做?
:有很多种方法,tmm3/4等等有,具体方法要去看文献或者找软件来做。
:对照组基因的相对表达量怎么计算?是2的负的deltaCt?
:不是的,2的负的deltaCt是以对照组为基础算出实验组的表达量。
:那怎么计算对照的一个基因的相对表达量呢?
:用相对表达量的算法,对照一般都为1吧,不知道你用的是哪个版本的qpcr仪器?
:iq5,有两个品种的对照要做比较。
:你选用一个作为对照就OK了,其他样本跟对照来比。

其他问题
:我在转录组里找到一条目的序列,但是我想看看库里(自己的无参考转录组)有没有和它有重叠序列的片段,该如何着手?
:用本地blast的方法可以实现。
:本地blast,我该upload什么数据呢?假如是转录组所有的数据,岂不是很大?
:以你的转录组建库,然后用你的目的序列去query
:可是转录组建库数据量很大,电脑可以运行的了吗?
:可以。
:用MEME网站进行motif预测时,可以单条序列粘贴进去吗?
:可以。
:它只会有邮箱的形式告诉结果吗
:是的。

哈啊哈哈
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
63
注册时间
2016.1.6
在线时间
303 小时

活跃会员


发表于 2016.1.10 12:11:19 | 显示全部楼层

回帖奖励 +2

这个比较好了,我还是比较喜欢的
我来了
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.30
在线时间
5 小时

发表于 2016.1.11 15:27:47 | 显示全部楼层

回帖奖励 +2

抱走
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
3
注册时间
2016.2.24
在线时间
31 小时

发表于 2016.2.24 10:31:41 | 显示全部楼层

回帖奖励 +2

赞一个奥比奥比
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
3
注册时间
2016.2.24
在线时间
31 小时

发表于 2016.2.24 10:32:26 | 显示全部楼层
赞一个奥比奥比奥币
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.2
在线时间
21 小时

发表于 2016.3.2 22:20:34 | 显示全部楼层

回帖奖励 +2

讲得比较详细~
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.2.24
在线时间
3 小时

发表于 2016.3.4 17:40:36 | 显示全部楼层
看来必须要学习R 啊
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.1
在线时间
4 小时

发表于 2016.3.7 10:21:23 | 显示全部楼层

回帖奖励 +2

折腾了好久的Trinity,不容易啊,膜拜
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
1
注册时间
2015.12.29
在线时间
20 小时

发表于 2016.3.8 11:35:52 | 显示全部楼层

回帖奖励 +2

好难找的回复呀! 谢谢分享,不记得听过这个课了,应该是我加入这个群之前讲的吧。好希望再讲一次,自己看ppt 还是有很多地方不明白。
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.3.9
在线时间
3 小时

发表于 2016.3.9 09:54:13 | 显示全部楼层
学习了,赞
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.11
在线时间
15 小时

发表于 2016.3.11 19:46:34 | 显示全部楼层
听了很有帮助的啊。
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.14
在线时间
26 小时

发表于 2016.3.14 17:55:41 | 显示全部楼层
太赞了,良心作品
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.16
在线时间
2 小时

发表于 2016.3.16 16:58:41 | 显示全部楼层
挺好的,赞
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.3.17
在线时间
2 小时

发表于 2016.3.17 09:58:16 | 显示全部楼层

回帖奖励 +2

看来得学R……
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.3.16
在线时间
3 小时

发表于 2016.3.17 10:48:56 | 显示全部楼层
好东西啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表