问30:请问实验比对不同时期的转录组,以找差异基因。转录组测序每个样品有3个生学重复,这样不同时期比对的话,怎么比对比较科学? 答:如果是3~4个时期,建议趋势分析。如果5个以上的数据,考虑进行共表达网络分析。
问31:除了趋势分析,还有什么方法可以减少seq后的候选基因? 答:趋势分析一般不是用来减少候选基因。
问32:在使用cufflinks中cuffcompare时,输出的.tracking文件中的转录本好像比在combined.gtf中的转录本多,是为什么呢? 答:这个要看实际的结果,一般情况下仅用来展示两者的相似程度。
问33:但是通过转录本的ID来看,为什么track的文件会比combined.gtf的多呢? 答:track一般把全部的转录本进行比较,combined一般都是过滤后的。
问34:就是说应该以combined的文件为准是吧? 答:是的。
问35:他是以什么样的原则过滤掉的呢? 答:可以参考一下compare的文档。
问36:RNA-seq做平行重复,结果如何分析,一致性要达到多少,才算ok?如果取差异表达基因,是不是挑两次或三次重复中均有变化的? 答:重复的样本的处理,是组间差异分析。
问37:gap填充如果没有填完,还有碱基没有确定,拿这些N是直接在最终的序列中跳过了呢?还是用N表示了? 答:用N表示。
问38:DEseq的标准化方法是什么? 答:有几种。deseq 默认的为上四分位标准化,另外还有TMM 等等。
问39:找到的SNP怎么知道在基因的哪个位置,CDS 或者其他的? 答:做注释,一般都是自己写程序注释SNP的位置。
问40:如果对照和试验组都是取混合样去测序的,后来的验证取每个样验证,这样可以减少混合样测序所产生的没有生物学重复的质疑吗? 答:不能,审稿人会质疑的,关键基因都使用qPCR验证,可以减少质疑。这是统计学的问题,没有重复,你无法说服我,这个结果是否准则。
问41:验证基因如何选择更好? 答:验证你研究关键基因。
问42:转录组测序得到lncRNA的序列,并不是它的全长吗?那定量的时候怎么设计引物呢?能根据测序得到的序列进行设计吗? 答:应该是全长,但由于实验上,测序上各种误差导致有可能不是全长;我们一般会预测一段lncRNA,根据这段序列进行设计引物。
问43:亲本有三种类型,两两杂交得到六种F1类型,每个F1类型内选取不同的极端材料测RNA-seq,相应的亲本也测了,现在找差异基因怎么找? 答:这个问题比较开放。这个实验设计,需要了解生物学背景,具体的讨论,可以与基迪奥技术沟通。
问44:实验组与对照组的样本不是一个批次的,怎样去除批次效应? 答:实验条件要控制好,这很难去除。
|