查看: 295|回复: 1

挖掘数据规律,全面直观的趋势分析怎么做?

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
666
注册时间
2020.6.16
在线时间
386 小时

发表于 2022.5.25 10:10:20 | 显示全部楼层 |阅读模式
分析涉及梯度处理(如时间变化、生长周期等)的数据时,常可以利用趋势分析,将大量基因通过聚类的方法归类至几个或者几十个趋势中,更简洁直观地找到具有代表性的基因集以及趋势特征。

如何进行趋势分析呢?

OmicShare云平台的趋势分析工具即可轻松完成分析。只需要输入表达量数据(RPKM、FPKM或TPM值),工具即可完成对数据的预处理,并进行趋势分析;甚至可以通过动态工具调整趋势展示顺序、删除多余趋势。

工具链接:
https://www.omicshare.com/tools/Home/Soft/trend


数据准备及参数选择

输入的源文件为样本表达量数据(RPKM、FPKM或TPM值)。如下表,表头为样本名称,第一列为基因ID。


Q:输入两组样本,为什么运行出错?
A:趋势分析的目的是看基因表达量变化趋势,三组及以上才能看出波动变化(如持续下调、先上调再下调等),因此必须输入三组及以上连续型样本


选中“添加描述信息”可以上传相关基因的注释信息等,输出结果时,信息会自动添加到表格中。

趋势数量:当样本数较多时,建议控制趋势输出数量,一般设置为20个,不建议超出50个;当样本数较少,如3个样本,理论上有8个趋势,即使趋势数量设置20,也按照8个趋势输出。

数据预处理可以选择“Log2标准化”、“标准化”和“不做标准化/加0” 。如果数据已经经过处理,选 不做标准化/加0 ,即直接用输入的原始值进行分析。

显著趋势的P值:默认将P值<0.05的趋势认为是显著趋势。

在趋势分析前需要过滤掉那些表达量变化不大的基因,设置“基因筛选的最小变化倍数”为2,则默认过滤掉表达量差异倍数小于2的基因。

输出结果

点击“提交”按钮,稍等片刻即可输出结果。点击“小眼睛”可以预览所有趋势图。点击第一个“下载”按钮,下载所有输出结果文件,包括单个趋势的展示图及相应趋势统计表、所有趋势的展示图总览、所有差异基因对应的趋势基因集统计表等。动态趋势分析攻击点击第三个“跳转查看”按钮,进行动态调整。


在输出的趋势总图中,有颜色的为显著富集的趋势,相同的颜色代表具有相同的趋势;不显著则没有颜色标注。


Q:不显著的趋势是否没有生物学意义?
A:不是。有颜色的显著富集的趋势值得优先重点关注,但这并不意味着不显著的趋势模块就不值得关注。因为统计显著性本身受很多因素的影响,显著性检验只是提供数据挖掘的优先级。

趋势分析动态调整

在动态趋势分析工具中,可以对趋势总数进行调整,包括字体调整、调整模块线条、趋势颜色、模块排序、删除模块等。

文字样式大小调整:


趋势列数、线条修改:


趋势背景颜色、线条颜色修改:


调整趋势顺序:


删除/恢复模块:


使用OmicShare趋势分析工具完成分析就是这么简单,后续就可以挑选显著的趋势模块或者具有生物学意义的模块进行分析了~


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.6.23
在线时间
61 小时

发表于 2022.5.26 16:28:46 | 显示全部楼层
感谢分享
新的一天加油!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表