|
每次用GO分析宝宝就凌乱了,分类关系有传递性吗?怎么推导它们之间的调控关系?语义之间的关系怎么定义?嗯,躺枪的同学默默流泪好了……
我们也是操碎了心,今天为大家科普一下GO数据库的规则。知识拿走,不谢~我们都知道GO数据的各个分类间(GO term)是呈现树状层级分类的(图1),那么层级间到底有什么样的关系呢,请看下面的图文解释:
图1 GO term间的有向无环图
一. GO term之间的关系
分类之间关系的基本理解
分类之间的关系有三种:is a、part of 和 regulates,接下来我们逐一来讲解每种情况。
1.Is a · is a → is a
Is a具有传递性,即如果A is a B,B is a C,那么A is a C。形式化表示为is a·is a→is a。例如下图:线粒体(mitochondrion)是一种胞内细胞器(intracellular organelle),而胞内细胞器是一种细胞器官(organelle),从而可以推出:线粒体是一种细胞器官。
图中的实线表示结点之间的关系,虚线表示推理而并未证明的关系。
2.Part of · part of→part of
Part of具有传递性,如果A is part of B,B is part of C,那么A is part of C。形式化表示为part of·part of→part of。同样如下图所示:线粒体(mitochondrion)是细胞质(cytoplasm)的一部分,细胞质又是细胞(cell)的一部分,从而可得出:线粒体是细胞的一部分。
3.part of · is a /is a · part of → part of
如果关系is a与part of组合,则其关系均为part of 。分别如下图所示:
调节控制关系及其推导
GO term中,如果某一过程直接影响另一过程或参数值(quality)的表现形式,我们称前者调节控制(regulates)后者。被调节的对象可以是一个过程,如生物通路、酶促反应等,也可以是一个参数值,如细胞大小,pH值等。与part of类似,调节控制关系也是充分非必要的,即:B能且仅能调节控制A,而A并非只受B的调节控制。例如:cellcycle checkpoint(细胞周期检查点)总是调节控制cellcycle(细胞周期),然而细胞周期并不单独受细胞周期检查点调节控制,还受其它过程的调节控制。
Regulates · is a →regulates、is a · regulates → regulates以及regulates · part of →regulates均为正确的推导关系,有点晕了是不,看下面示意图会清晰一点:
另外,截至目前,尚不能确定part of · regulates→???、regulates · regulates→???为何种关系。
二. GO的组织结构
GO委员会除了要定义语义(term)以外,还要定义该语义与其它语义之间的关系,使语义总体构成有一定结构的语义词汇表。Ontology的结构可以用图表示,其中语义表示为结点,其间的关系表示为结点之间的边。当然GO语义之间的关系是单向的,例如:线粒体(mitochondrion)是一个细胞器(organelle),可以表示为:A mitochondrion is an organelle,但反过来不成立,细胞器不是一个线粒体!
在这种意义上说,ontology的结构更像是有向非循环树,其中离根结点越近的结点越概括,离叶子结点越近的结点越具体,GO 定义的术语有着直接非循环式(directed acyclic graphs)的特点,而并非是传统的等级制定义方式(随着代数增加,下一级比上一级更为具体)。
但与有向非循环树不同的是,ontology结构图中的结点可以有两个及其以上的父结点。例如:生物过程当中的语义已糖合成就有两个父结点,已糖代谢和单糖合成。其并不难理解,因为已糖(hexose)是一种单糖(monosaccharide),生物合成过程(biosyntheitcprocess)也是一种生物代谢过程(metabolicprocess)。
Anyway,ontology中部分语义结构的图形化看这里:
三. GO聚类分析
文章中出现的GO聚类分析的图表,列出了第一class和第二class,便于反应差异基因的生物学特性。第二class中的每个term又包含很多的子term。经常会有gene产物对应多个term,比如参与多个生物学过程,在多个细胞组分出现等。一般每个term都会对应多个基因产物。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|