趋势分析





1:

选择文件 格式示例



基因表达量表,第一列为基因id,后面为样品表达量,趋势顺序按样品在表格中的顺序排列。


*

当 两个时间点间变化的趋势数量取1的时候,趋势总个数为3^(n-1)-1,n表示样品个数,如3个样品理论上有8个趋势,当点较多时,可以输入控制输出趋势个数,如5个点理论有80个趋势,可以选择输出20个有代表性的趋势。
*
类型1:输入为基因表达量,与第一个点比较求出log2(FC),格式如:log2(v1/v1),log2(v2/v1),log2(v3/v1)…
类型2:输入为log2(FC):即已经对数据做log2(FC)处理,格式如:v1-v1,v2-v1,v3-v1…
类型3:add0:适用于已经对数据做log2(FC)做处理的数据,程序默认会过滤掉没有趋势的情况(即变化一致的情况会被过滤掉),在前面加0就能够输出这种情况(如:平行处理组相对于对照组都是增加了两倍)。格式如:0,v1,v2,v3…


默认将P值<0.05的趋势认为是显著趋势
(大于0的值)

两个点间的表达量低于最小变化趋势会认为没有变化,默认为2倍。
添加描述信息  

  任务完成后发邮件通知我

 使用一次消耗奥币数 5



趋势分析图工具使用教程和参数详解

功能:
趋势分析是针对多个连续型样本(至少3个)的特点(样本间包含特定的时间、空间或处理剂量大小顺序)而对基因的表达模式(在多阶段中表达曲线的形状)进行聚类的方法。通过趋势分析可以找到具有相同表达模式的基因。


输入:
输入的表格文件,必须为txt格式。可以选择在excel中将数据打开,然后另存为"文本文件(制表符分隔)(*.txt)"。输入源表格文件: 基因表达量表,第一列为基因id,后面为样品表达量,趋势顺序按样品在表格中的顺序排列。基因注释信息文件的第一列为基因名,其他列为相应基因的描述信息。


参数:

① 趋势的数量:当 两个时间点间变化的趋势数量取1的时候,趋势总个数为3^(n-1)-1,n表示样品个数,如3个样品理论上有8个趋势,当点较多时,可以输入控制输出趋势个数,如5个点理论有80个趋势,可以选择输出20个趋势。


②数据预处理:
  a.Log2标准化:输入为基因表达量,与第一个点比较求出log2(FC),即(log2(v1/v1),log2(v2/v1),log2(v3/v1)…),做趋势分析。
  b.标准化:直接用数据做趋势分析,即(v1-v1,v2-v1,v3-v1…),做趋势分析。
  c.不做标准化/加0:STEM程序会过滤掉没有趋势的情况(即变化一致的情况会被过滤掉),在数据前加0处理,即(0,v1,v2,v3…),就能够输出这种情况(如:平行处理组相对于对照组都是增加了两倍)


③显著趋势P值:默认将P值<0.05的趋势认为是显著趋势


④最小变化倍数:两个点间的表达量低于最小变化趋势会认为没有变化,默认为2倍。


⑤注释信息:第一列是基因名,其他列是对应的基因注释信息。


输出:

①all_profile.xls:趋势汇总文件。

②all.xls:所有基因文件。

③trend_all_by_gene_number.png:显示基因数量的趋势总图

④trend_all_by_pvalue.png:显示P值的趋势总图。

⑤Profile*.png:单个趋势的图。

⑥Profile*.xls:单个趋势的结果文件。

示例文件:趋势分析例子文件   描述信息文件

生物云平台

输出结果:

1. trend_all_by_gene_number.png,trend_all_by_pvalue.png 趋势分析结果总览,按照基因数量和p值排序,统计各个趋势的结果。下图是按p值排序的统计结果。

生物云平台


2.all.xls 基因表达量总表,包含基因id,和各个分组的表达量信息,运行添加注释信息则会包 含注释信息



3. all_profile.xls 基因趋势总表,各个分组的值为处理后的值,profile表示趋势的序号,SPOT为程序运行时的基因序号。运行添加注释信息则会包含注释信息

生物云平台


4. profile[0-n].png,profile[0-n].xls 各个趋势的结果图,下图所示,以及各个趋势的结果表格(基因id以及各组表达量信息,运行添加注释信息则会包含注释信息)

生物云平台