查看: 91545|回复: 49

第13期“基因表达量计算与差异表达分析(上)”【视频】

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


发表于 2016.2.25 17:27:45 | 显示全部楼层 |阅读模式
在线交流“基因表达量计算与差异表达分析”

交流视频已经上传,请前往1楼观看!

敲锣打鼓,奔走相告!开年第一期交流马上就要来了。本期交流我们将重点讨论“基因表达量计算与差异表达分析”

交流时间:2016年3月2日 下午4点-6点
交流QQ群:425346734




基因表达量计算和差异表达分析,这两项分析是转录组数据分析的基础。在接下来的两期节目中,我们将会详细介绍这两项分析的原理和常见的计算方法。并且进一步讨论不同方法的优缺点和对后续数据分析的影响。

在第本期交流中,我们将会详细介绍转录组分析中基因(转录本)表达量计算的方法。转录组表达量计算简要说来分为三个步骤:
(1)比对:将测序得到reads 比对到参考序列上;
(2)Read count计算:估算每一个基因(转录本)相应的reads 数量;
(3)Read count归一化:将每一个基因(转录本)的reads数量转化为基因的表达量值,便于样本间的比较。

我们将重点讨论第3个步骤涉及的问题:如何将readscount转化为基因的表达量。因为表达量计算的准确性,直接将影响后续相关分析的可靠性。交流主要讨论两点:

(1)一条read是否可以代表一条转录本?同时衍生出三个定义:RPKM、FPKM以及TPM,那么三者间有什么区别?因为在不同的测序项目中,可能会涉及到三个不同的概念,因此可能会给大家带来一些混淆。

(2)二代测序的表达定量,本质和荧光定量PCR相同:需要参照一个标准来换算出每个基因的表达量。这个参考标准可能是样本的总数据量,可能是样本中基因表达量的中位数,也可能是内参基因。那么,不同处理策略间有什么优缺点?在特定项目中,选用错误的策略会对后续的结果产生什么影响?我们将使用一些实际案例来解释这些问题。




本次在线交流的PPT下载:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2016.2.26 17:21:17 | 显示全部楼层
新的一天加油!
回复 支持 5 反对 2

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
128
注册时间
2015.11.12
在线时间
838 小时

推广达人宣传达人论坛元老


 楼主| 发表于 2016.2.26 17:21:45 | 显示全部楼层
本次在线交流主要内容如下:

问1:
可不可以用DESeq归一化的normalizedcounts进一步计算RPKM??
答:可以的。Normalized counts 使用RPKM的换算公式可以直接转化为RPKM值。

问2:下面这张图怎么理解?
                                                         
答:这张图是经典的Maplot。每个点代表一个基因。Y轴代表的是基因在两个样本的表达差异倍数。X轴代表基因在两个样本表达量的乘积。
黄色的点代表只在某一特异样本高表达的基因。这类基因表达差异倍数比较大, Y轴上偏离0。但是乘积又非常小,所以在X轴的数值较小。所以意味着这类基因在一个样本表达量高一个样本表达量低,即可以理解为这个基因只在一个样本上表达。
绿色位置的这些基因表达量在两个样本都比较高的,因为它的乘积也比较大,但在Y轴数值在零值附近,表达其没有差异表达,这类基因一般是看家基因。另外,在样本间进行reads counts校正的参照基因也属于此类基因。
其他位置基因还包括一些在Y轴偏离0,但在X轴数值也较大的基因,表明在两个样本都有比较高表达量,而且有比较大的差异倍数的基因。

问2:下面不同比对方案分别对应的是哪些软件?
read count (多重比对的问题)
丢弃
平均分配
利用Unique region估计并重新分配

答:此处的分析,不属于比对软件要处理的问题。而是属于后期的处理,可以通过写脚本或某些软件处理。
当reads比对到多个地方的时候,有两种方法,一种是平均分配,一种是多重比对的时候不清楚是属于谁,然后将其丢弃。前两种方法可以通过写脚本来处理。我们发现这种丢弃的方法在绝大多数情况下还是相当的准确和稳定的,这也是最早期方法。第三种方法是RSEM与cufflinks这两种软件使用的方法(这两个软件一般基于bowtie2或tophat的比对结果进行处理)。由于存在几个转录本为可变剪切或者存在基因家族,所以有一些同源的区域完全相似的,必然导致某些reads多重比对。但是这几个转录本或者编码基因肯定有些地方是独一无二的,这些位置的地方reads则是唯一比对的。软件根据唯一比对的reads数比例,来重新分配那些多重比对的reads,即通过Unique mapping reads来分配那些multi-mapping比对的reads。

问3:用fpkm时做cuffdiff时,不同时间点的处理,用到的gtf文件是需要把所有样品的gtf文件merge到一起吗?
答:是的。因为最后有一个合并的过程,是需要把所有样品的gtf文件merge到一起,不然没有办法比较表达量。

问4:请问无参转录组,利用RSEM计算的结果里面是有count,TPM以及FPKM值,这些数值我是可以直接用于后续的差异分析的吗?还是只用count值呢?
答:如果使用DEseq或edger做差异分析一定要用count来计算,因为deseq与edger已经考虑到了用count值来计算差异表达更加准确,而不是用其他。

问5:FKPM只能针对PE(双端测序)的数据计算么?
答:FKPM实际上算的是fragment,当然是双端的数据算一个fragment。如果是SE数据,RPKM与FKPM应该是没有区别了,因为是单端测序,每个reads就代表一个片段,当然也是可以计算FKPM的,因为一条reads就是一条片段,是等效的。

问6:reads 长度分布统计怎么计算,怎么画出长度分布图呢?
答:可以写脚本,长度分布图展示方法可以尝试画饼图或者柱形图来展示。

问7:RPKM类算法是什么意思?
答:就是说这类算法基本是以mRNA为总量来计算基因表达量的。

问8:RSEM与RPKM的区别?
答:两者是两个定义,RSEM是reads count的多重比对的软件,核心是怎么算基因的reads count。我们公司目前的无参转录组流程也会用到RSEM,最后我们将算出来的reads count换算成RPKM来计算,所以RSEM更多是种reads counts统计软件,基于它的统计结果可以换算成RPKM、FPKM或TPM。

问9:请问如果用HTseq-count的结果count做差异分析,可以用Cuffdiff得出的FPKM当表达量画热图或趋势分析吗?
答:可以得。
BTW,在做差异分析的时候用count是合理的,如果用基因长度做校正后会掩盖一些问题。因为差异分析软件其实考虑到了reads counts给定量带来的误差。理论上如果一个基因reads数越多的话,表达量定量越稳定的,误差越小。反之,count数越少,定量误差越大。但如果进行RPKM校正后,一个低reads counts的基因,如果由于其基因长度较短,则反而会得到一个高的RPKM值。这样相当于丢失了原始的reads counts信息。count进行差异分析更加合理,所以大部分差异分析软件采用未进行基因长度校正的reads counts为输入进行差异分析。
所以做差异分析的时候,用deseq 或edger用count来计算是对的。但后续的分析,例如绘制热图,依然建议换算成RPKM后进行处理。


更多问答整理请下载PDF文档查看:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复 支持 2 反对 0

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
26
注册时间
2016.1.13
在线时间
257 小时

突出贡献优秀版主


发表于 2016.3.2 11:17:44 | 显示全部楼层
期待期待,带着小白一起飞。。。
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
20
注册时间
2016.3.2
在线时间
58 小时

发表于 2016.3.2 14:43:22 | 显示全部楼层
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
0
注册时间
2016.1.15
在线时间
277 小时

活跃会员


发表于 2016.3.3 12:35:25 | 显示全部楼层
期待期待
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.2.26
在线时间
10 小时

发表于 2016.3.5 10:53:39 | 显示全部楼层
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.1.10
在线时间
57 小时

发表于 2016.3.6 23:08:47 | 显示全部楼层
顶起来,
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.1
在线时间
4 小时

发表于 2016.3.7 10:38:40 | 显示全部楼层
好好啊!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.10
在线时间
6 小时

发表于 2016.3.10 10:23:52 | 显示全部楼层
哪有视频?没有找到啊

点评

在沙发那楼  发表于 2016.3.10 10:28
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.10
在线时间
6 小时

发表于 2016.3.10 10:37:54 | 显示全部楼层
是我浏览器不支持吗?沙发那楼只是一大片空白,没有加载视频啊
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2016.3.16 09:40:22 | 显示全部楼层
shiyidu 发表于 2016.3.10 10:37
是我浏览器不支持吗?沙发那楼只是一大片空白,没有加载视频啊

应该是浏览器不支持,用一些主流的高版本的浏览器都能看到,搜狗 360 火狐 谷歌等都可以
有问题请发贴提问
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.10
在线时间
6 小时

发表于 2016.3.16 15:16:04 | 显示全部楼层
小瑶 发表于 2016.3.16 09:40
应该是浏览器不支持,用一些主流的高版本的浏览器都能看到,搜狗 360 火狐 谷歌等都可以 ...

我用chrome和safari都试了,一片空白,
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2016.3.17 15:32:12 | 显示全部楼层
shiyidu 发表于 2016.3.16 15:16
我用chrome和safari都试了,一片空白,

adobe flash播放器有没有安装? 电脑是不是少了一些软件
有问题请发贴提问
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
52
注册时间
2016.1.8
在线时间
276 小时

突出贡献优秀版主论坛元老


发表于 2016.3.17 18:02:52 | 显示全部楼层
好东西,继续跟踪
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
3
注册时间
2016.1.8
在线时间
27 小时

发表于 2016.3.28 15:28:16 | 显示全部楼层
视频可以下载吗?谢谢
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
49
注册时间
2015.12.5
在线时间
547 小时

活跃会员论坛元老


发表于 2016.3.29 13:32:03 | 显示全部楼层
qh2012 发表于 2016.3.28 15:28
视频可以下载吗?谢谢

可以从Youku下载。
新的一天加油!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.1.14
在线时间
4 小时

发表于 2016.4.8 14:59:09 | 显示全部楼层
谢谢分享,太实用了
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.5
在线时间
13 小时

发表于 2016.5.13 21:52:16 | 显示全部楼层
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
2
注册时间
2016.7.6
在线时间
15 小时

发表于 2016.7.6 17:16:14 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表