查看: 41128|回复: 52

[其他] GO数据库的分类层级说明

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
126
注册时间
2015.11.12
在线时间
792 小时

推广达人宣传达人论坛元老


发表于 2016.4.26 11:44:12 | 显示全部楼层 |阅读模式
每次用GO分析宝宝就凌乱了,分类关系有传递性吗?怎么推导它们之间的调控关系?语义之间的关系怎么定义?嗯,躺枪的同学默默流泪好了……



我们也是操碎了心,今天为大家科普一下GO数据库的规则。知识拿走,不谢~我们都知道GO数据的各个分类间(GO term)是呈现树状层级分类的(图1),那么层级间到底有什么样的关系呢,请看下面的图文解释:




图1 GO term间的有向无环图

一. GO term之间的关系

分类之间关系的基本理解
分类之间的关系有三种:is a、part of 和 regulates,接下来我们逐一来讲解每种情况。
1.Is a · is a → is a
Is a具有传递性,即如果A is a B,B is a C,那么A is a C。形式化表示为is a·is a→is a。例如下图:线粒体(mitochondrion)是一种胞内细胞器(intracellular organelle),而胞内细胞器是一种细胞器官(organelle),从而可以推出:线粒体是一种细胞器官。


图中的实线表示结点之间的关系,虚线表示推理而并未证明的关系。
2.Part of · part of→part of
Part of具有传递性,如果A is part of B,B is part of C,那么A is part of C。形式化表示为part of·part of→part of。同样如下图所示:线粒体(mitochondrion)是细胞质(cytoplasm)的一部分,细胞质又是细胞(cell)的一部分,从而可得出:线粒体是细胞的一部分。



3.part of · is a /is a · part of → part of
如果关系is a与part of组合,则其关系均为part of 。分别如下图所示:



调节控制关系及其推导
GO term中,如果某一过程直接影响另一过程或参数值(quality)的表现形式,我们称前者调节控制(regulates)后者。被调节的对象可以是一个过程,如生物通路、酶促反应等,也可以是一个参数值,如细胞大小,pH值等。与part of类似,调节控制关系也是充分非必要的,即:B能且仅能调节控制A,而A并非只受B的调节控制。例如:cellcycle checkpoint(细胞周期检查点)总是调节控制cellcycle(细胞周期),然而细胞周期并不单独受细胞周期检查点调节控制,还受其它过程的调节控制。
Regulates · is a →regulates、is a · regulates → regulates以及regulates · part of →regulates均为正确的推导关系,有点晕了是不,看下面示意图会清晰一点:


另外,截至目前,尚不能确定part of · regulates→???、regulates · regulates→???为何种关系。
二. GO的组织结构

GO委员会除了要定义语义(term)以外,还要定义该语义与其它语义之间的关系,使语义总体构成有一定结构的语义词汇表。Ontology的结构可以用图表示,其中语义表示为结点,其间的关系表示为结点之间的边。当然GO语义之间的关系是单向的,例如:线粒体(mitochondrion)是一个细胞器(organelle),可以表示为:A mitochondrion is an organelle,但反过来不成立,细胞器不是一个线粒体!
在这种意义上说,ontology的结构更像是有向非循环树,其中离根结点越近的结点越概括,离叶子结点越近的结点越具体,GO 定义的术语有着直接非循环式(directed acyclic graphs)的特点,而并非是传统的等级制定义方式(随着代数增加,下一级比上一级更为具体)。
但与有向非循环树不同的是,ontology结构图中的结点可以有两个及其以上的父结点。例如:生物过程当中的语义已糖合成就有两个父结点,已糖代谢和单糖合成。其并不难理解,因为已糖(hexose)是一种单糖(monosaccharide),生物合成过程(biosyntheitcprocess)也是一种生物代谢过程(metabolicprocess)。
Anyway,ontology中部分语义结构的图形化看这里:



三. GO聚类分析




文章中出现的GO聚类分析的图表,列出了第一class和第二class,便于反应差异基因的生物学特性。第二class中的每个term又包含很多的子term。经常会有gene产物对应多个term,比如参与多个生物学过程,在多个细胞组分出现等。一般每个term都会对应多个基因产物。
                    

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
哈啊哈哈
回复

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2016.3.31
在线时间
129 小时

发表于 2016.4.26 12:31:42 | 显示全部楼层
长知识了,学习一下,controlled, hierarchal, directed acyclic
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
15
注册时间
2016.4.20
在线时间
457 小时

突出贡献优秀版主论坛元老


发表于 2016.4.26 14:09:35 | 显示全部楼层
(点击阅读原文查看拓展阅读:Can a single gene product be annotated with more than one GO term? )
链接不见了
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2016.4.26 16:47:29 | 显示全部楼层
Wuii 发表于 2016.4.26 14:09
(点击阅读原文查看拓展阅读:Can a single gene product be annotated with more than one GO term? )
链 ...

你知道得太多啦!
补上链接:http://geneontology.org/faq/can- ... ed-more-one-go-term
有问题请发贴提问
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
15
注册时间
2016.4.20
在线时间
457 小时

突出贡献优秀版主论坛元老


发表于 2016.4.26 18:35:08 | 显示全部楼层
小瑶 发表于 2016.4.26 16:47
你知道得太多啦!
补上链接:http://geneontology.org/faq/can-single-gene-product-be-annotat ...

热爱学习的小伙伴啊,都是这样的一丝不苟,帅气凌人
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2016.4.26 20:58:10 | 显示全部楼层
Wuii 发表于 2016.4.26 18:35
热爱学习的小伙伴啊,都是这样的一丝不苟,帅气凌人

是美丽可爱好吗
有问题请发贴提问
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
3
注册时间
2016.3.23
在线时间
236 小时

突出贡献优秀版主


发表于 2016.4.26 22:26:06 | 显示全部楼层
我居然看完了
我要看看,我到底有多么的喜欢你!
回复 支持 反对

使用道具 举报

功夫熊猫

Rank: 10Rank: 10Rank: 10

主题
1
注册时间
2016.4.25
在线时间
797 小时

灌水之王


发表于 2016.4.27 10:18:16 | 显示全部楼层
我也学这个。难
恩泽
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.4.1
在线时间
17 小时

发表于 2016.5.4 11:06:28 | 显示全部楼层
长知识了
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
10
注册时间
2016.4.7
在线时间
216 小时

活跃会员突出贡献论坛元老


发表于 2016.5.8 21:35:51 来自手机 | 显示全部楼层
学习了,多点类似的帖子,我们小白就成长了。
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
注册时间
2016.5.18
在线时间
4 小时

发表于 2016.5.18 11:24:39 | 显示全部楼层
本人新手,学习学习
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
12
注册时间
2016.5.21
在线时间
24 小时

发表于 2016.5.22 13:20:49 | 显示全部楼层
学习ing
回复

使用道具 举报

帝王蝶

Rank: 4

主题
12
注册时间
2016.5.22
在线时间
78 小时

发表于 2016.5.25 16:21:18 | 显示全部楼层
从临床狗跳到生信坑,天了噜,面对这么多知识,简直要爆炸了
回复 支持 1 反对 0

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.30
在线时间
14 小时

发表于 2016.5.31 12:54:12 | 显示全部楼层
学习了~~~~~~
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.30
在线时间
14 小时

发表于 2016.6.3 00:36:37 | 显示全部楼层
长知识了
回复

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2016.5.26
在线时间
82 小时

发表于 2016.7.13 17:28:35 | 显示全部楼层
学习了。现在天天泡你家论坛看帖子

点评

哈哈  发表于 2016.7.14 11:19
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.4.23
在线时间
19 小时

发表于 2016.7.29 17:50:05 | 显示全部楼层
GO 分类的第二class和第三class的GO聚类,各类的terms是怎样的?比如nucleotide binding这一term属于第几class term啊
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
30
注册时间
2016.5.24
在线时间
192 小时

发表于 2016.8.23 11:22:11 | 显示全部楼层
   GO数据库的分类层级一共可以分为几个层级?
   文章中出现的GO聚类分析的图表,列出了第一class和第二class,第二class中的每个term又包含很多的子term,这些子term可以理解为是第三class,那么还有分为第四class吗?
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.5.5
在线时间
7 小时

发表于 2016.8.31 09:08:42 | 显示全部楼层
看了,但还是不是特别懂
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.9.5
在线时间
1 小时

发表于 2016.9.5 21:11:53 来自手机 | 显示全部楼层
如果可以分很多层class的话go数据库早分了,之前看过,底层的go可能对应好几个第二class的,而且时不时的还有些废弃的go
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表