功能:相似性分析(ANOSIM of similarities, ANOSIM)是一种用于分析高纬度数据组间相似性的非参数检验方法。它首先通过变量计算对象间距离测度(或者相似度),然后计算关系排名,最后通过排名进行置换检验判断对象组间差异是否显著不同于组内差异。多用于各个组学中,如:16S、宏基因组、转录组、蛋白质组、代谢组等组学研究,判断组内样本重复性及组间样本是否存在显著差异。
输入文件:
(1)丰度矩阵或样本距离矩阵
丰度矩阵:以微生物物种丰度矩阵为例,第一列为物种(OUT),第二列往后是物种在不同样本中的丰度信息。文件格式支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。
示例文件如下(以OUT丰度表为例):
样本距离矩阵:以细菌群落间的Bray-curtis距离为例。每一列为一个样本,每一行为一个样本。数字信息表示样本间的距离。
(2)分组文件:第一列为样本名称,第二列为分组名称。文件格式支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。示例文件如下:
图形填充颜色:用户自定义选择
输出文件
以压缩包文件输出。压缩文件中包含表格文件(.xls)和图形文件(pdf格式、png格式),其余文件为OS平台源文件。
(1)表格文件
表头注释:Group:进行Anosim分析的组 ;R:Anosim分析的R值;P_value:显著性P值
(2)图形文件
图形解读:盒型图纵轴表示距离排名,横轴between表示组间距离,其他表示对应分组组内距离。R值表示组间与组内的差异程度。R的范围为[-1,1]。R<0组间差异小于组内差异;R>0组间差异大于组内差异;R=0组间差异等于组内差异。
盒型图参数解释:
N:样本数;
Median:中位数
Q3:上四分位数
Q1:下四分位数
IOR:四分位距,interquartile range,即Q3-Q1
max:Q3+1.5IQR范围内的最大值
min:Q1-1.5IOR范围内的最小值
outlier:异常值/离群值,即小于Q1-1.5IOR或Q3+1.5IQR的值
notch:中位数95%置信区间(confidence intervals)的范围,即
输入文件:
(1)以丰度矩阵为例:
下载示例文件,保存为文本文件(*.txt)格式
(2)分组文件:下载示例文件,保存为文本文件(*.txt)格式
输出文件:
(1)表格文件:
(2)图形文件:
表格文件、图形文件详细解读可参考【说明】文档
Q1. 上传的数据需要保存成什么格式?文件名称和拓展名有没有要求?
OmicShare当前支持txt(制表符分隔)文本文件、csv(逗号分隔)文本文件、以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。如果是核酸、蛋白序列文件,必须为FASTA格式(本质是文本文件)。
文件名可由英文和数字构成,文件拓展名没有限制,可以是“.txt”、“.xlsx”、“.xls”、“.csv”“.fasta”等,例如 mydata01.txt,gene02.xlsx 。
Q2. 提交时报错常见问题:
1.提交时显示X行X列空行/无数据,请先自查表格中是否存在空格或空行,需要删掉。
2.提交时显示列数只有1列,但表格数据不止1列:列间需要用分隔符隔开,先行检查文件是否用了分隔符。
其它提示报错,请先自行根据提示修改;如果仍然无法提交,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。
Q3. 提交的任务完成后却不出图该怎么办?
主要原因是上传的数据文件存在特殊符号所致。可参考以下建议逐一排查出错原因:
(1)数据中含中文字符,把中文改成英文;
(2) 数据中含特殊符号,例如 %、NA、+、-、()、空格、科学计数、罗马字母等,去掉特殊符号,将空值用数字“0”替换;
(3)检查数据中是否有空列、空行、重复的行、重复的列,特别是行名(一般为gene id)、列名(一般为样本名)出现重复值,如果有删掉。
排查完之后,重新上传数据、提交任务。如果仍然不出图,可通过左侧导航栏的“联系客服”选项咨询OmicShare客服。
Q4.下载的结果文件用什么软件打开?
OmicShare云平台的结果文件(例如,下图为KEGG富集分析的结果文件)包括两种类型:图片文件和文本文件。
图片文件:
为了便于用户对图片进行后期编辑,OmicShare同时提供位图(png)和矢量图(pdf、svg)两种类型的图片。对于矢量图,最常见的是pdf和svg格式,常用Ai(Adobe illustrator)等进行编辑。其中,svg格式的图片可用网页浏览器打开,也可直接在word、ppt中使用。
文本文件:
文本文件的拓展名主要有4种类型:“.os”、“.xls”、“.log”和“.txt”。这些文件本质上都是制表符分隔的文本文件,使用记事本、Notepad++、EditPlus、Excel等文本编辑器直接打开即可。结果文件中,拓展名为“.os”文件为上传的原始数据;“.xls”文件一般为分析生成的数据表格;“.log”文件为任务运行日志文件,便于检查任务出错原因。
Q5. 提交的任务一直在排队怎么办?
提交任务后都需要排队,1分钟后,点击“任务状态刷新”按钮即可。除了可能需运行数天的注释工具,一般工具数十秒即可出结果,如果超出30分钟仍无结果,请联系OS客服,发送任务编号给OmicShare客服,会有专人为你处理任务问题。
Q6. 结果页面窗口有问题,图表加载不出来怎么办?
尝试用谷歌浏览器登录OmicShare查看结果文件,部分浏览器可能不兼容。