查看: 2357|回复: 28

[其他] 【案例分享】两个样品画热图

  [复制链接]
  • TA的每日心情

    2017.11.10 13:58
  • 签到天数: 353 天

    连续签到: 2 天

    [LV.8]以坛为家I

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    422
    奥币
    7396
    积分
    6608
    注册时间
    2015.11.23
    在线时间
    952 小时

    宣传达人优秀版主


    发表于 2015.11.25 15:09:01 | 显示全部楼层 |阅读模式
    之前有个帖子介绍了热图,楼主在这里再分享一个画热图的例子
    一般我们作热图都会先对数据进行均一化处理,以消除因量纲差异导致的聚类关系失真、数值波动范围过大的影响。(这是正常而又正确的)

    但是当分析的样品只有两个的时候,数据均一化就失去了意义了,为什么呢?

    先看下面的例子:

    左面的图是进行了Z-score均一化后画出来的热图,只有红色和绿色两种颜色,没有过渡色,非常难看。为什么会这样呢?

    原因就在于,Z-score是一种对数据进行标准化的方法,其计算方法为减去均值除以标准差。

    当只有两个样本时,每个数据减去均值后必定是一正一负,并且绝对值相等,再除以标准差,这就使得所有样本标准化后的值都只有一正一负两个数值了。所以热图就呈现出只有一种红色和一种绿色。

    右面的图是没有进行数据均一化的,用基因的表达量RPKM值来画,这就比较正常了,有颜色渐变。但是大家有没有发现,刻度尺范围比较大,绝大部分是绿色?

    这是因为绝大部分的基因表达量都在10以下,只有两个基因在30以上,这就使得颜色都往绿色扎堆了。试想想,如果有一两个基因的表达量异常高,这个热图可能也就是几乎一片绿了。

    这个时候,比较好的方法是用两个样品基因表达量的差异倍数来作图,这样就变成单列热图了,可以消除异常高表达基因对整体热图的影响,并且直观展现两个样品之间的基因表达量差异。如下图所示,是不是好看清晰多了?

    所以,做热图前对数据进行均一化还是非常有必要的。两个样品画热图,不能进行数据均一化,有时候要根据数据具体情况,用两个样品基因表达量的差异倍数来画热图。嗯,就酱紫~

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x

    点评

    单列的热图,只能用R包的pheatmap 画,其他的包会报错。  发表于 2016.2.18 16:01
    有问题请发贴提问
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    11 小时前
  • 签到天数: 65 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    11
    奥币
    1332
    积分
    651
    注册时间
    2015.10.28
    在线时间
    400 小时

    论坛元老热心会员


    发表于 2015.11.27 15:10:54 | 显示全部楼层
    这个内容由基迪奥小师妹提供,赶紧围观一下~:lol
    开放·共享·生信论坛
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.9.21 09:09
  • 签到天数: 38 天

    连续签到: 1 天

    [LV.5]常住居民I

    帝王蝶

    Rank: 4

    主题
    13
    奥币
    1621
    积分
    200
    注册时间
    2015.11.23
    在线时间
    31 小时

    发表于 2015.12.9 09:47:03 | 显示全部楼层
    赞 解决了我纠结好久的问题了 太棒了
    回复 支持 1 反对 0

    使用道具 举报

  • TA的每日心情

    2016.1.14 15:24
  • 签到天数: 10 天

    连续签到: 1 天

    [LV.3]偶尔看看II

    草履虫

    Rank: 2

    主题
    0
    奥币
    503
    积分
    20
    注册时间
    2015.12.9
    在线时间
    4 小时

    发表于 2015.12.9 11:40:59 | 显示全部楼层
    非常棒的帖子,,非常直观的展示两组样本比较的差异,除了利用差异倍数来画热图,是不是也可以取log10(FPKM),缩小原始FPKM值得差异,然后不按行均一化进行热图分析??
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2015.12.25 16:02
  • 签到天数: 4 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    草履虫

    Rank: 2

    主题
    0
    奥币
    418
    积分
    12
    注册时间
    2015.12.10
    在线时间
    2 小时

    发表于 2015.12.10 23:47:54 | 显示全部楼层
    楼主牛逼!!
    回复

    使用道具 举报

  • TA的每日心情

    2016.10.21 09:23
  • 签到天数: 87 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    17
    奥币
    3052
    积分
    1136
    注册时间
    2015.12.7
    在线时间
    141 小时

    优秀版主


    发表于 2015.12.12 16:39:02 | 显示全部楼层
    楼主请留步 发表于 2015-12-9 11:40
    非常棒的帖子,,非常直观的展示两组样本比较的差异,除了利用差异倍数来画热图,是不是也可以取log10(FPKM ...

    这个方法也是可以的啊!这样数值间的差异就变小了,颜色就不会一边倒了
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.10.21 09:23
  • 签到天数: 87 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    17
    奥币
    3052
    积分
    1136
    注册时间
    2015.12.7
    在线时间
    141 小时

    优秀版主


    发表于 2015.12.13 10:50:14 | 显示全部楼层
    基迪奥小师妹 发表于 2015-12-12 16:39
    这个方法也是可以的啊!这样数值间的差异就变小了,颜色就不会一边倒了 ...

    画出来的图是这样的哈:

    也很不错呢!所以,目前有两种方法画两个样品的热图哈!

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.8.26 10:01
  • 签到天数: 69 天

    连续签到: 1 天

    [LV.6]常住居民II

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    1164
    积分
    74
    注册时间
    2015.12.8
    在线时间
    18 小时

    发表于 2015.12.14 15:58:21 | 显示全部楼层
    我觉得吧,用Z-score的方法按行均一化,优点是不同列之间的差异会比较明显,缺点是不同行之间不能比较;去log的方法的话,总体还是可以比较的,不过个别列之间的差异可能不好区分,或者说肉眼看不出来,不知道这样理解对不对。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.3.29 11:25
  • 签到天数: 45 天

    连续签到: 1 天

    [LV.5]常住居民I

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    752
    积分
    69
    注册时间
    2015.12.8
    在线时间
    9 小时

    发表于 2015.12.15 10:04:30 | 显示全部楼层
    admin 发表于 2015-11-27 15:10
    这个内容由基迪奥小师妹提供,赶紧围观一下~:lol

    给基迪奥小师妹点赞!

    点评

    基迪奥小师妹好棒,点赞  发表于 2016.2.18 13:08
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.10.21 09:23
  • 签到天数: 87 天

    连续签到: 1 天

    [LV.6]常住居民II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    17
    奥币
    3052
    积分
    1136
    注册时间
    2015.12.7
    在线时间
    141 小时

    优秀版主


    发表于 2015.12.15 10:07:21 | 显示全部楼层
    Flier 发表于 2015-12-14 15:58
    我觉得吧,用Z-score的方法按行均一化,优点是不同列之间的差异会比较明显,缺点是不同行之间不能比较;去l ...

    你的理解挺正确的,取Log值之后数值之间的差异就变小了,所以要具体看数据分布情况,也不是每种情况取log值都是合适的
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    5 天前
  • 签到天数: 143 天

    连续签到: 2 天

    [LV.7]常住居民III

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    23
    奥币
    1863
    积分
    361
    注册时间
    2015.12.17
    在线时间
    112 小时

    活跃会员优秀版主


    发表于 2015.12.21 22:45:14 | 显示全部楼层
    小姑凉,真聪明!大叔赞一个!
    我外在的一本正经掩饰不住内心的闷骚!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.7.13 15:48
  • 签到天数: 37 天

    连续签到: 1 天

    [LV.5]常住居民I

    钵水母

    Rank: 3Rank: 3

    主题
    2
    奥币
    1035
    积分
    149
    注册时间
    2016.1.7
    在线时间
    37 小时

    发表于 2016.1.7 22:02:18 | 显示全部楼层
    我顶顶顶
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    12 小时前
  • 签到天数: 425 天

    连续签到: 1 天

    [LV.9]以坛为家II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    19
    奥币
    4273
    积分
    1526
    注册时间
    2015.12.29
    在线时间
    375 小时

    突出贡献优秀版主热心会员


    发表于 2016.1.8 16:53:03 | 显示全部楼层
    赞一个
    回复

    使用道具 举报

  • TA的每日心情
    好棒
    2018.6.2 12:23
  • 签到天数: 365 天

    连续签到: 1 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    45
    奥币
    3109
    积分
    1642
    注册时间
    2016.1.6
    在线时间
    163 小时

    活跃会员


    发表于 2016.1.9 11:51:09 | 显示全部楼层
    这个不错,越来越喜欢了

    点评

    有用的帖子可以收藏起来噢~  发表于 2016.1.11 09:18
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    好棒
    2018.6.2 12:23
  • 签到天数: 365 天

    连续签到: 1 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    45
    奥币
    3109
    积分
    1642
    注册时间
    2016.1.6
    在线时间
    163 小时

    活跃会员


    发表于 2016.1.12 13:12:54 | 显示全部楼层
    这样的帖子才是好帖子
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2016.8.31 15:44
  • 签到天数: 19 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    491
    积分
    158
    注册时间
    2015.12.30
    在线时间
    5 小时

    发表于 2016.1.13 09:29:29 | 显示全部楼层
    赶紧抱走。。。。哈哈哈
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    吃饭
    12 小时前
  • 签到天数: 240 天

    连续签到: 53 天

    [LV.8]以坛为家I

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    1269
    积分
    236
    注册时间
    2016.1.13
    在线时间
    63 小时

    发表于 2016.1.19 16:40:30 | 显示全部楼层
    非常棒的帖子
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    2018.4.23 11:48
  • 签到天数: 41 天

    连续签到: 1 天

    [LV.5]常住居民I

    帝王蝶

    Rank: 4

    主题
    1
    奥币
    659
    积分
    278
    注册时间
    2015.12.29
    在线时间
    19 小时

    发表于 2016.2.18 13:09:05 | 显示全部楼层
    好贴
    回复

    使用道具 举报

    该用户从未签到

    草履虫

    Rank: 2

    主题
    0
    奥币
    395
    积分
    5
    注册时间
    2016.4.7
    在线时间
    1 小时

    发表于 2016.4.11 17:11:01 | 显示全部楼层
    请问楼主,最后一张图应该是根据两个样品基因表达差异倍数的log2的值来做的吧?而不是帖子里面说的基因表达量的差异倍数!请指教!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017.12.27 11:46
  • 签到天数: 23 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    4
    奥币
    494
    积分
    146
    注册时间
    2016.4.8
    在线时间
    27 小时

    发表于 2016.4.12 09:11:31 | 显示全部楼层
    单列热图怎么做,分享点代码最好啦
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表