查看: 37558|回复: 39

第3期在线交流“lncRNA测序数据挖掘”回顾

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


发表于 2015.12.29 16:03:45 | 显示全部楼层 |阅读模式
第3期在线交流“lncRNA测序数据挖掘”回顾


2015年8月25日,基迪奥在信息交流群(QQ群:67185986)举办了lncRNA测序相关的交流,交流的问答整理如下:



在线交流PPT在此下载:


1IncRNA在复合体中的作用机制是怎样的呢?
答:lncRNA的作用机制比较多样,包含作为复合物骨架,decoyguide等作用。可以查阅相关的综述,来了解这些作用机制的实例。

2super -enhancer会被转录为RNA吗?
答:是的。 已经有相关报道表明,enhancer通过产生 enhancerRNA(来源增强子的lncRNA)来起到转录增强的调控作用。因此,Super enhancer 极有可能被转录为lncRNA

3有没有对疑似lncRNA进行分析的数据库?
答:lncRNA的鉴定主要包括:1)同源比对;2)编码蛋白能力的预测。
前者,主要是是一些序列收录的数据库,例如noncode 数据库。如果能在这些数据库中找到同源序列,就可以对lncRNA 进行初步的判定;
如果是后者,还是需要自己使用一些软件,例如CPC ,进行分析。暂时还没有听说,哪些数据库提供蛋白编码能力预测的分析。

4怎么做lncRNA的功能?有些什么机制?好像筛出来lncRNA但机制并不好做
答:包括:敲除,过表达、pulldown等。 只要在 CNS 级别的期刊,一般在找到候选lncRNA后,会有详细的功能验证试验。 机制验证的试验当然不好做,要找到正确的候选lncRNA,且试验比较耗费时间。难度越大,文章回报也越高。

5对于lncRNA,预测的RPKM值低于多少认为其没有表达?
答: 这个要看需要,一般情况0.01以下就可以认为不表达

6设计Q-PCR引物验证是不是很难?
答:一般不是很难。

7H3K4ME1H3K27AC ,高富集的区域,会不会可能产生lncRNA
答:当然可能。

8RNAseqmiRNA测序结果中能够预测出lncRNA么?
答:miRNA有难度, RNAseq可以。

9lncRNA序列里面好像有很多连续的相同碱基,对设计引物没有影响吗?
答:当然有影响了,gc含量高了,引物的退火温度也要高,不容易结合

10已知lncRNA下载怎样的格式啊?
答:没有固定的格式,比如fastagtfgff之类的都可以用。

11测序出来的结果包括lncRNAmRNA,那是不是测序的数据量要比普通的mRNA测序要大?
答:是的。目前大部分测序公司推荐的lncRNA测序量是10g。推荐测10g2个原因吧。第一个原因,因为毕竟同时测lncRNAmRNA本身信息比较大,自然需要更大的数据量;另外lncRNA表达量相对低一点,所以需要测到lncRNA的话,理论上就需要更深的数据量。但同时有个问题,因为测lncRNA是采用去核糖体RNA的方法,去核糖体RNA的方法无法保证能够把核糖体去得干干净净的,所以最后的测序数据里面都会多多少少比较多的核糖体的残留,那意味着我们有效的数据就偏少,所以需要比较大的数据来保证有效数据。就是说测得多才能保证剩下的数据是足够的。
12怎么发现新的lncRNA
答:组装算法→进行预测

13为什么不用phyloCSF
答:首先使用范围比较窄,phyloCSF更适用于哺乳动物。其次是phyloCSF原理是经验密码子模型,只适用于特定区域内的编码。

14共表达模块分析样本量需要多大才跟可靠?
答:18个,一般12个我们也可以做。

15对于那些lncRNA表达量大,而它的靶标表达量小,这种也算共表达吧?
答:共表达并不是指的表达量,而是表达趋势,当然量太小也没有意义。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 16:05:27 | 显示全部楼层
16做差异分析用什么样的软件,比如差异MRNA基因集合LncRNA基因集?我有两份数据,mRNA的和lncRNA的芯片结果,怎么结合找到共同的相关基因呢?
答:2个方法。样本多,样本多用wgcna;样本少,用相关性。


17我的样本有四组,每组3个样品,可以做WGCNA吗?我的样本是4还是12呢?
答:这属于4个处理,12个样本。样本量偏少,我们不建议分析。


18水稻好做lncRNA吗?
答:应该来说是比较好做的。因为水稻的参考基因组质量比较好。所以做水稻lncRAN还是比较容易的。


19lncRNA可以在原核中做不?                     
答:纯分析的角度是可以的。但是目前我们接触到的文献关于原核生物lncRNA的报道还比较少,所以说在原核生物上做lncRNA还是有风险的。并不是说不能做,而是说担心没有或很少。另外,我们都知道用原核生物来做转录组的话本身就是去核糖体的策略,因为原核生物编码基因也没有poly-A尾结构,所以如果你做原核转录组测序的话,也是可以顺便分析一下lncRNA,这个是没有问题的。


20请问,针对含有病菌的叶片组织,能否有效去除或者区分病菌的lncRNA?能否一个同时针对病菌和植株进行lncRNA分析?
答:嗯,这个问题问得挺好的。因为这个也是病原宿主互作经常遇到的问题。理论上来说,你的叶片是有病菌感染的,做了测序之后是可以将病原与宿主的基因测出来的。不过最大的问题是,微生物的基因丰度会非常低。这里分析的话有2个难点,一个是必须保证微生物的丰度基因足够多,那意味着你取样要很准,如果取样不准的话,你取样组织里面大量是健康的植物细胞,只有一部分是有微生物感染的,那么在你最后提的RNA里面,微生物的基因丰度极低,极低的话意味着你通过测序的话,病菌的RNA将检测不到或检测太低,那么表达量的信息就不准,所以第一个就是这个微生物问题。
然后第二个问题是,能够有效区分、去除病菌的lncRNA,去除病菌的lncRNA的话意味着病菌要有参考基因组,如果没有参考基因组,也就没有办法对病菌lncRNA进行分析的。


21cuffdiffedger在处理重复样的时候的差别是什么,最后的表达量是怎么得到的?
答: 没啥差别。统计算法都一样。差别在于处理基因的不同转录本的reads分配。


22许多lncRNAmRNA是有重叠的,因此在设计引物做RT的时候,是不是要避开这部分重叠的部分?
答:这个问题也问得非常好,我们认为由2种情况,第一种lncRNAmRNA如果在反义链上还好,比如一个在正链上,一个在反链上,因为有5‘ 3’,所以这个设计引物是没有问题的。如果是第二种情况,应该找两种序列特异的部分设计引物。


23lncRNA表达量很少的话如何做蛋白预测和pulldown实验?
答:应该是lncRNA表达量很少的话做polldown实验难度是很大的。但是我们目前看过的文章,lncRNA做验证的话都会挑表达丰度比较高的,因为表达丰度低的做实验难度比较大。


24我看过一篇文章,作者从单核糖体和多核糖体上分离RNA来做测序,只发现一个lncRNA,这种数据准吗?
答:这个问题很难回答。因为现在核糖体相关的RNA测序也是目前比较火的一个技术。目前这个技术更多的是研究与核糖体结合的mRNA。目前做过转录组和蛋白组关联分析的老师应该清楚,他们之间的转录组与蛋白的关联是非常差的,因为目前蛋白质谱的技术不怎么稳定,所以定量不是很准;另外从mRNA到蛋白中间经历了很多转录或修饰等等变化,所以蛋白的表达量与mRNA的表达量相关性很差,所以目前采取核糖体mRNA来测序的技术。据文献报道这种测序技术,结果是与蛋白相关性很强的,因为,既然是mRNA结合在核糖体上,那么基本上认为是可以翻译的。但是如果说找到一条lncRNA,这个到底准不准不好说,也有可能吧。因为lncRNA功能很多,在某些情况下是可以翻译一些小肽的,所以我认为说分离出lncRNA是正常的。


25老师,怎么用R做出主成分分析的结果和图?
答:使用主成分分析的模块gmodels,里面有例子介绍如何使用。


26你好,我想问问,想做一个药物对肿瘤细胞作用的机制探讨,是做基因组学还蛋白组学好?
答:做药物代谢的话,先入手的话,因为目前蛋白组学不是很成熟,除非你有明确的目标,某个药物会影响某个蛋白,如果这样的话可以做蛋白,如果不是,我们建议从基因组转录组入手,因为目前蛋白组研究还不是很成熟,可以鉴定的蛋白会比较少,另外误差也比较大,所以做基因组学会比较好一点。

27能讲一讲关于lncRNAmicrRNA相互作用,以及lncRNA二级结构预测的生物信息学方面的内容吗?
答: 其实目前从文献报道来看micrRNAlncRNA的作用机制,其实就跟micrRNA靶向mRNA机制是类似的,其实这种靶向更多是种物理现象,只要他们结合就会作用。所以这种靶基因预测跟mRNA靶基因预测没有大的区别。从生物学角度来看,就是ceRNA看,lncRNA会把microRNA吸附走了,自然microRNA丰度下降了,自然对microRNA起保护作用。
我们看到比较多的是预测发夹结构的,很少是软件是预测二级结构的,所以你可以去找一下更复杂的一些软件。


28老师做蛋白质组处理1h,蛋白来得及表达吗??
答:我觉得你这个问题是很难回答的,因为有些基因是很快表达的,有些基因是需要10h表达的,所以建议查看一下文献,因为生物应答时间有长短。


29我的链特异性文库,在用tophat比对的时候,我没有设置链特异性的参数,对后续分析影响大不。
答:影响不大,但如果是分析lncRNA的话,那就影响就大了。


30拼接是用cufflinks么?如果cufflinks拼接出来的结果中发现延长了某些基因的转录本,而这只是因为已知的基因注释不正确,是否会被误认为是lncRNAmRNA重叠的情况?
答:是的,如果你不关心antisense,只关心基因间的lncRNA

新的一天加油!
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 16:06:49 | 显示全部楼层
31ceRNA机制是不是不好做?
答:其实从生物信息分析角度来说,不难。


32lncRNAmiRNA共表达分析,据说不靠谱,不太可信,是不是这样?
答:我的观点是,所有的生物信息分析都是预测。这个不靠谱取决于样本量,样本量越少假阳性越多,样本量越多假阳性越少。然后是后续的数据解读吧。


33那如果一个物种即做了转录组,又做了蛋白组,怎么解释和取舍?
答:不同的分析使用不同的算法,取舍不一样。我的建议是,整体还OK的话,就写一篇文章吧,但如果一致性真的很差的话,那么你就写2篇文章吧。


34老师计算FPKM值时用的unique-mapped-reads,与计算测速深度时coverage表格里的unique-mapped-readsunigenes数与compare里对应样品的FPKM大于0unigenes数应该相等吗?
答:一般不会相等。


35 计算FPKM时计算的是那些unigenesFPKM呢?为什么和计算测序深度的unigenes不是一样的呢?
答:因为一般低表达的基因会被舍去啊,像某些软件计算fpkm就会认为不表达。计算深度的每条reads都会计算。


36线虫做ceRNA好做吗?
答:应该挺好做的。从分析角度来说不是很难,但是后期实验来说是不好做。


37如果测序长度和cufflinks默认参数不一样,并且也没有专门设置,会后影响后面结果嘛?
答:不会。因为cufflinks会自己计算长度,不需要你来计算。


38请问拼接是用cufflinks么?如果cufflinks拼接出来的结果中发现延长了某些基因的转录本,而这只是因为已知的基因注释不正确,是否会被误认为是lncRNAmRNA重叠的情况?
答:更有可能是可变剪切,5‘3’波动是很大的,所以这完全是种正常的现象。


39低丰度的lncRNA功能比较难做,那么表达量多高的lncRNA值得我们挑选来做呢?我看 H19 表达量也不高,1.4
答:尽量选择RPKM值大于10的来做,或者后续实验来说的话,建议挑表达量高的来做


40在转录组数据中,通过后续分析发现unigene里面有内含子,并且有些unigene很长,有超过10000bp,怎么会这样呢?
答:如果unigene超过10k,这个很有可能不是RNA,很有可能是DNA残留,是一条DNA序列,也有一定可能是mRNA前体,但很大可能是一段DNA序列。


41如果找到一个lncRNA,如何找到下游靶点来做呢?
答:建议找到lncRNA的话,建议优先从顺式作用考虑,看看周边有没有有意思的mRNA,不过总体来说从lncRNA来找mRNA会比较困难。可能需要双方面来找,建议先别确定某个lncRNA,可以挑几个表达量比较高的lncRNA,再看看周边有没有有意思的mRNA,然后再确定lncRNA来找下游靶点。


42为什么找lncRNA 周围的?
答:因为靶基因太多了,所以挑选周围的,从顺式作用考虑,让筛选更容易。


43转录组差异有1万多个,怎么会这么多差异基因呢?
答:总基因有多少呢?
问:5
答:一般情况的差异10%不算大,如果加上组织特异性,20%~30%也不算不对。所以要根据你的样本实际情况来判断。


44lncRNA结合蛋白的motif可以分析吗?
答:应该挺难的,如果你知道怎么分析可以告诉我们。

45我们发现网上公布的一个基因的启动子拼接顺序好像有错误,上游启动子的序列好像接到下游了。这样我们还能做免疫共沉淀吗??
答:既然发现有错误,想做这个基因的话,做下PCR实验,把序列扩出来,再做免疫共沉淀。看到基因组组装有错误是很正常的现象。


新的一天加油!
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2015.12.29 16:08:39 | 显示全部楼层
46现在做DEG测序 10M够吗? 样本是小鼠肿瘤组织?
答:这个样本量是够了。


47老师,看了贵公司的产品目录,有lncRNA二级结构分析预测、共表达网络预测功能,lncRNAsmrna反向互补三种分析,每种分析需要哪些数据?还有没有其他的数据分析服务提供?
答:目前这些分析都是针对lncRNA测序的,如果做共表达网络的话,建议8个或8个以上样本。哪些服务我们很难回答,主要是看你的样本、实验目的、生物学背景等等来确定分析方案。


48lncRNA的转录起始位点可以通过生物信息学预测吗?
答:可以分析。


49转录组数据中很多是跟基础代谢相关,是不是这部分数据分析意义不大?
答:如果你的实验涉及到与基础代谢相关,那么这部分数据就有意义。但如果你的实验处理没有涉及到就没有意义。所以说,还是需要跟你的实验背景相关。


50基迪奥有没有涉及到ncRNA的调控网络方面的研究?
答:有的,一般都是跟mRNA进行关联。

51GO分析里的代谢过程和KEGG的通路以及mapman之间的差异是什么呢?
答:其实GOKEGG是两个独立功能注释数据库吧。两个数据库都是做功能注释的。两个的区别主要是数据上的区别,比如KEGG在代谢通路上做得最好的数据库,GO是做功能分类数据库的。然后mapman是一个分析软件,用的GO数据库结果,是做用来分析GO数据库的,然后它画的图比较漂亮。


52我在目的基因的互补链上发现一个疑似lncRNA,请问该lncRNA是不是针对该目的基因的?
答:建议做一个qPCR实验,可以将lncRNA与宿主的做一个表达量定量,看看是正相关还是负相关,如果相关的话,可以做一个干扰实验,看看宿主基因是否发生变化,以及宿主细胞表型是否有变化。


53那一般如果要做RT验证的话,筛选RPKM值多大以上的能够验证出来?
答:这个实际上越大越好,之前我做的项目最小10rpkm可以检测到。


54那一般如果要做RT验证的话,筛选RPKM值多大以上的能够验证出来
答:一般看实验方法和需要,10rpkm或者1fpkm都能验证出来。当然,表达量越高,验证率也越高。


550.01-0.1之间的lncRNA通过RT-PCR能验证出来吗?
答:很难了。


56go的代谢谢过程也可以理解为KEGG的通路吗?
答:其实GO的数据比较全但是比较粗糙,KEGG的比较窄但是比较精细。实际做项目的话,可以两种结合,互补结合的效果。


57链特异性建库和非链特异性建库,对于后续分析有什么影响??
答:有影响,可以区分正负链信息,比对更加准确。
问:正负链信息?是说反义转录组?
答:是的,可以这么理解。
问:那么通常是建议做正义链还是反义链?
答:不是正义链和反义链,链特异文库一般用来看reads是从哪条链上出来的。
问:较于之前的非链特异性建库,现在的链特异性建库,在分析上也没有什么差别吧?
答:分析上没有大的差别。


58一般除去外源污染reads有什么方法?
答:2种策略,如果外源污染是确定的,并且是有参的,就注释去掉。
如果不知道是哪种污染,直接做拼接,与微生物库及NR数据库比对,然后进行打分,比如那种打分更高就认为是该种基因,然后再进行去掉。


59老师,lincsenseantisense都能识别吗,具体怎么识别啊?
答:都能识别,用链特异文库就可以。

60senseantisense在估计表达量的时候是使用的cufflink计算的结果吗?
答:是的

61Nr注释结果一条序列对应很多结果,后面该如何处理?
答:blast之后,挑一个打分最高的,打分最高的视为同源序列。


62cis作用的话一般lncRNA的上游还是下游?
答:不一定。可能是上游也有可能下游,上游会多一点。


63我打算做itraq请问我做的全谱分析里面是否包含磷酸化蛋白组的分析?那我如果要分析差异磷酸化蛋白,该怎么办?
答:以我们的经验来讲,不建议分析,因为这个分析结果是非常不可靠的。而且用itraq来分析蛋白磷酸位点非常不可靠,目前我们公司分析里面是不带这条分析的。


64蛋白组要不要做重复?
答:我们实话实说,要发高分文章,要做重复。但如果想发一个34分左右的文章,可以不做重复,因为蛋白重复性并不好。


65trinity组装后的gene ID怎么看?(下图)
                             
答:这个是基于基因组的组装,第一个是染色体信息,第二个是clust ,第三个基因,第四个isoform
问:那么通常说的unigene是指第三个ID
答:是的。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.1
在线时间
4 小时

发表于 2016.3.7 10:25:28 | 显示全部楼层
总是走在前端
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.16
在线时间
2 小时

发表于 2016.3.16 17:02:24 | 显示全部楼层

谢谢 非常有帮助
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.4.7
在线时间
5 小时

发表于 2016.4.7 20:35:40 | 显示全部楼层
藻类也能做长非编码RNA的研究吗,有啥研究意义呢
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2016.4.8 12:57:25 | 显示全部楼层
Minghua Liang 发表于 2016.4.7 20:35
藻类也能做长非编码RNA的研究吗,有啥研究意义呢

有参考基因组就可以做lnc
新的一天加油!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.5
在线时间
13 小时

发表于 2016.5.13 16:54:57 | 显示全部楼层
感谢分享
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.6.2
在线时间
5 小时

发表于 2016.6.3 00:33:01 | 显示全部楼层
very nice!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.13
在线时间
78 小时

发表于 2016.6.5 18:22:52 | 显示全部楼层
老師,請問沒有參考基因組可以做lncRNA嗎?
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.6.6
在线时间
0 小时

发表于 2016.6.6 17:03:48 | 显示全部楼层
过于简单,有更深入点的材料吗?
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.6.6
在线时间
26 小时

发表于 2016.6.7 12:00:31 | 显示全部楼层
感谢万能的群
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
34
注册时间
2016.5.11
在线时间
751 小时

活跃会员突出贡献


发表于 2016.6.12 14:04:41 | 显示全部楼层
很有用的总结
新的一天加油!
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
30
注册时间
2016.5.24
在线时间
270 小时

发表于 2016.6.27 17:32:30 | 显示全部楼层
一般物种中能够鉴定的LncRNA数目有多少?
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2016.6.28 10:42:34 | 显示全部楼层
daiwenting 发表于 2016.6.27 17:32
一般物种中能够鉴定的LncRNA数目有多少?

一般在数据库中模式生物的比较多,具体的因物种不同而不同,同时lncRNA 有组织特异性和时空特异性,因此同一个物种在不同组织或者不同的发育时期也可能不同。


新的一天加油!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.6.23
在线时间
64 小时

发表于 2016.6.28 20:58:53 | 显示全部楼层
感谢分享
新的一天加油!
回复

使用道具 举报

帝王蝶

Rank: 4

主题
5
注册时间
2016.3.5
在线时间
61 小时

发表于 2016.6.29 15:08:29 | 显示全部楼层
lnc转录本的平均长度比mRNA都要短吗
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
1
注册时间
2016.8.1
在线时间
115 小时

发表于 2016.9.15 17:40:02 | 显示全部楼层
都是干货,有待操练
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.8.10
在线时间
143 小时

发表于 2016.9.20 14:13:02 | 显示全部楼层
谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表