查看: 13445|回复: 30

[其他] 【案例分享】两个样品画热图

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2015.11.25 15:09:01 | 显示全部楼层 |阅读模式
之前有个帖子介绍了热图,楼主在这里再分享一个画热图的例子
一般我们作热图都会先对数据进行均一化处理,以消除因量纲差异导致的聚类关系失真、数值波动范围过大的影响。(这是正常而又正确的)

但是当分析的样品只有两个的时候,数据均一化就失去了意义了,为什么呢?

先看下面的例子:

左面的图是进行了Z-score均一化后画出来的热图,只有红色和绿色两种颜色,没有过渡色,非常难看。为什么会这样呢?

原因就在于,Z-score是一种对数据进行标准化的方法,其计算方法为减去均值除以标准差。

当只有两个样本时,每个数据减去均值后必定是一正一负,并且绝对值相等,再除以标准差,这就使得所有样本标准化后的值都只有一正一负两个数值了。所以热图就呈现出只有一种红色和一种绿色。

右面的图是没有进行数据均一化的,用基因的表达量RPKM值来画,这就比较正常了,有颜色渐变。但是大家有没有发现,刻度尺范围比较大,绝大部分是绿色?

这是因为绝大部分的基因表达量都在10以下,只有两个基因在30以上,这就使得颜色都往绿色扎堆了。试想想,如果有一两个基因的表达量异常高,这个热图可能也就是几乎一片绿了。

这个时候,比较好的方法是用两个样品基因表达量的差异倍数来作图,这样就变成单列热图了,可以消除异常高表达基因对整体热图的影响,并且直观展现两个样品之间的基因表达量差异。如下图所示,是不是好看清晰多了?

所以,做热图前对数据进行均一化还是非常有必要的。两个样品画热图,不能进行数据均一化,有时候要根据数据具体情况,用两个样品基因表达量的差异倍数来画热图。嗯,就酱紫~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

点评

单列的热图,只能用R包的pheatmap 画,其他的包会报错。  发表于 2016.2.18 16:01
有问题请发贴提问
回复

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
13
注册时间
2015.10.28
在线时间
566 小时

论坛元老热心会员


发表于 2015.11.27 15:10:54 | 显示全部楼层
这个内容由基迪奥小师妹提供,赶紧围观一下~:lol
新的一天加油!
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
13
注册时间
2015.11.23
在线时间
31 小时

发表于 2015.12.9 09:47:03 | 显示全部楼层
赞 解决了我纠结好久的问题了 太棒了
回复 支持 1 反对 0

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.9
在线时间
7 小时

发表于 2015.12.9 11:40:59 | 显示全部楼层
非常棒的帖子,,非常直观的展示两组样本比较的差异,除了利用差异倍数来画热图,是不是也可以取log10(FPKM),缩小原始FPKM值得差异,然后不按行均一化进行热图分析??
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.10
在线时间
2 小时

发表于 2015.12.10 23:47:54 | 显示全部楼层
楼主牛逼!!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
17
注册时间
2015.12.7
在线时间
145 小时

优秀版主


发表于 2015.12.12 16:39:02 | 显示全部楼层
楼主请留步 发表于 2015-12-9 11:40
非常棒的帖子,,非常直观的展示两组样本比较的差异,除了利用差异倍数来画热图,是不是也可以取log10(FPKM ...

这个方法也是可以的啊!这样数值间的差异就变小了,颜色就不会一边倒了
回复 支持 反对

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
17
注册时间
2015.12.7
在线时间
145 小时

优秀版主


发表于 2015.12.13 10:50:14 | 显示全部楼层
基迪奥小师妹 发表于 2015-12-12 16:39
这个方法也是可以的啊!这样数值间的差异就变小了,颜色就不会一边倒了 ...

画出来的图是这样的哈:

也很不错呢!所以,目前有两种方法画两个样品的热图哈!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.8
在线时间
18 小时

发表于 2015.12.14 15:58:21 | 显示全部楼层
我觉得吧,用Z-score的方法按行均一化,优点是不同列之间的差异会比较明显,缺点是不同行之间不能比较;去log的方法的话,总体还是可以比较的,不过个别列之间的差异可能不好区分,或者说肉眼看不出来,不知道这样理解对不对。
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.8
在线时间
9 小时

发表于 2015.12.15 10:04:30 | 显示全部楼层
admin 发表于 2015-11-27 15:10
这个内容由基迪奥小师妹提供,赶紧围观一下~:lol

给基迪奥小师妹点赞!

点评

基迪奥小师妹好棒,点赞  发表于 2016.2.18 13:08
回复 支持 反对

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
17
注册时间
2015.12.7
在线时间
145 小时

优秀版主


发表于 2015.12.15 10:07:21 | 显示全部楼层
Flier 发表于 2015-12-14 15:58
我觉得吧,用Z-score的方法按行均一化,优点是不同列之间的差异会比较明显,缺点是不同行之间不能比较;去l ...

你的理解挺正确的,取Log值之后数值之间的差异就变小了,所以要具体看数据分布情况,也不是每种情况取log值都是合适的
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
23
注册时间
2015.12.17
在线时间
165 小时

活跃会员优秀版主


发表于 2015.12.21 22:45:14 | 显示全部楼层
小姑凉,真聪明!大叔赞一个!
我外在的一本正经掩饰不住内心的闷骚!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
2
注册时间
2016.1.7
在线时间
38 小时

发表于 2016.1.7 22:02:18 | 显示全部楼层
我顶顶顶
回复

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
21
注册时间
2015.12.29
在线时间
452 小时

突出贡献优秀版主热心会员


发表于 2016.1.8 16:53:03 | 显示全部楼层
赞一个
新的一天加油!
回复

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
63
注册时间
2016.1.6
在线时间
303 小时

活跃会员


发表于 2016.1.9 11:51:09 | 显示全部楼层
这个不错,越来越喜欢了

点评

有用的帖子可以收藏起来噢~  发表于 2016.1.11 09:18
我来了
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
63
注册时间
2016.1.6
在线时间
303 小时

活跃会员


发表于 2016.1.12 13:12:54 | 显示全部楼层
这样的帖子才是好帖子
我来了
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.30
在线时间
5 小时

发表于 2016.1.13 09:29:29 | 显示全部楼层
赶紧抱走。。。。哈哈哈
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2016.1.13
在线时间
197 小时

发表于 2016.1.19 16:40:30 | 显示全部楼层
非常棒的帖子
下午好。。
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
1
注册时间
2015.12.29
在线时间
20 小时

发表于 2016.2.18 13:09:05 | 显示全部楼层
好贴
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.4.7
在线时间
2 小时

发表于 2016.4.11 17:11:01 | 显示全部楼层
请问楼主,最后一张图应该是根据两个样品基因表达差异倍数的log2的值来做的吧?而不是帖子里面说的基因表达量的差异倍数!请指教!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
4
注册时间
2016.4.8
在线时间
44 小时

发表于 2016.4.12 09:11:31 | 显示全部楼层
单列热图怎么做,分享点代码最好啦
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表