一篇RNA测序文章,你需要画哪些图?
比如我们完成RNA测序后,判断数据是否可靠,一般的文章的常用做法都有两种,①重复样本的重复性;②样本关系是否符合预期。
通常的做法是,重复样本的重复性用散点图来体现,样本关系是否符合预期用PCA聚类及热图来实现。
其实,散点图与PCA、热图可以说是生物信息分析图的老三样儿啊! 所以,画一个漂亮的散点图、热图是我们的必备技能啊啊啊啊。
比如这个散点图 (图左)重复性较差的两个重复样本,点分布较离散,相关系数较低。 (图右)重复性较好的两个重复样本,点分布集中在对角线,相关系数高。
然后PCA图也是SCI必备 PCA图可以直观表现样本聚类关系(与预期是否一致),也可以发现异常样本(离群样本),必要时把离群样本舍去再做后续分析。
热图 在文章中太普遍了,所以会画热图也是一个科研人员的必备素养有木有。 颜色代表表达量高低,直观展示某类基因的整体表达模式特点
另一方面,很多老师对RNA测序的后续差异性分析有着强大需求。 但差异统计的常用图形你会画吗。
条形图 比较简单,不多说。
频率直方图 理想状态下,所有基因的差异倍数,接近标准正态分布(图左) 差异巨大的样本间或受外源RNA污染的样本,差异倍数分布可能会出现偏离(图右真是不能忍)
唯恩图
直观展示不同基因集的交集和并集。
当然还有更漂亮的维恩图 这个维恩图在基迪奥生物信息小工具网站上也有。
还有盒形图 展示若干组值(例如不同基因家族差异表达倍数)的均值,四分位数和分布情况。利用盒形图,可以直观展现某组值(某转录组因子,某些人群)的均值和分布不同于其他值。
这些图很基本,但用来发文章又很实用。那么问题来了,这些图怎么画的?我都不会啊。呵呵哒,近期我们将推出新的生物工具云平台,敬请关注~
|