查看: 61440|回复: 44

第8期在线交流“转录因子结合位点及靶基因预预测"【视频】

  [复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


发表于 2016.1.7 09:18:41 | 显示全部楼层 |阅读模式
第8期在线交流“转录因子结合位点分析及靶基因预测”回顾


2015年11月18日,基迪奥在信息交流群(QQ群:67185986)举办了转录因子结合位点分析及靶基因预测交流会,交流的问答整理如下:






http://www.omicshare.com/class/Home/Index/singlev?id=2

问1:转录因子指的是蛋白质?
答:是的。


问2:这种图用什么软件可以画出来?

答:MEME、weblogo都可以。
如果想要得到更好看的图片,可以试试LATEX


问3:转录因子怎么预测靶基因?
答:转录因子结合到什么区域具有保守性的,如果已经知道转录因子结合的序列是什么特点,可以在基因上游2K区域找这段序列,如果可以找到,那么这段序列就是潜在的能够被该转录因子结合。


问4:转录因子怎么找启动子序列?
答:首先,启动子序列没有很严格的定义,通常认为定义基因上游2K左右为潜在的启动子区,而到底转录因子结合到什么区域,要具体做靶基因预测。


问5:怎么知道是序列是转录因子?
答:使用序列在转录因子数据库进行blast 比对。


问6:请问JASPAR能分析细菌的转录因子么?
答:JASPAR数据库是由开发的转录因子结合位点(TFBS)数据库 链接:http://jaspar.binf.ku.dk/
对于JASPAR数据库,包括脊椎动物,线虫纲,昆虫,植物,真菌,TF结构分类。


问7:JASPAR结果 strand 有正有负怎么取舍?
答:为什么要取舍呢,转录的时候,其实两条链都可以转录的。

问8:请问用什么方法可以在寻找已知蛋白的结合蛋白时,假阳性最小?是blast比对吗?
答:是的。蛋白与蛋白的相互作用应该是PPI的相互作用。


问9:PPI的结果是预测的吗?可信度多高?
答:是预测的,可信度问题无法很好定义,所以后续要做酵母双杂交或免疫共沉淀实验验证;预测是无法解决问题的,只是给我们提供一些筛选结果,缩小验证范围。


问10:转录因子找到的靶基因的启动子结合位点,是不是我们研究基因的启动子?
答:不一定,预测的结果还是需要验证实验来证实。而且一个转录因子可能有多个靶基因启动子结合位点。


问11:如果一个基因序列没有2000bp,会有启动子区吗?
答:这里可能混淆了两个概念,通常说的启动子序列2K不算在基因序列里面。而基因序列通常是从转录起始位点开始算的;启动子序列是从转录起始位点上游开始算的,但同时这也是一种经验性、保守的说法,也有可能一些转录因子的启动子序列不是2K,或者是更远的基因上游部分,2K通常囊括了大部分的启动子序列。


问12:在RNA-seq的差异表达的list里面有几个TF,有没有比较好的方式把TF的target形成的网络搞出来?
答: RNA-seq结果可以2个有用信息。
第一,如果TF在jasper数据库已经有人报道了有这个model,那么就可以利用靶基因预测的方法去找TF的target基因。

第二,如果你的RNA-seq样本比较多,比如10个、8个,那么TF的target基因可能是很多的, 这时需要过滤一下。可以计算潜在target与TF表达的相关系数,如果存在潜在的正相关,就可以判定可能是被调控的。这样过滤完,一个TF剩下的target可能就几十个。接下来,把结果导入到cytoscape里面进行可视化,那么调控网络就可以做出来了。


问13:请问一下在细菌里,已知一段启动子序列,怎么寻找可以与之结合的潜在转录因子呢?
答:在JASPAR数据库里面,将报道过的该启动子序列把他拿出来,包含的motif,全部预测一遍,就可以找到转录因子。


问14:组蛋白修饰的启动子区域有没有特定的序列?
答:没有特定的序列。因为组蛋白修饰染色体的某个状态,他是没有特定的规律的,比如H3K4三甲基化,他有时是可以转化成一甲基化的,或者不甲基化,或者乙酰化。这是说规律是可以调整的,所以组蛋白修饰更多是一个表观调控的一部分,他并没有非要什么样的序列来说被修饰的。


问15:为什么启动子区一定要三甲基化呢?
答:这是因为三甲基化染色质的结构是不一样的,但因为染色体结构不一样,意味着空间结构不一样;打个比方,一个转录复合物结合到的区域就相当于一个停车位一样的,所以组蛋白修饰状态不一样,它的复合物结合不上去。所以如果是一甲基化的,复合物结合不上去,自然就不可能是一个转录因子结合位点。
所以三甲基化这个信息是比较准确判断这个是否是个转录因子结合位点的非常可靠的一个参考信息。


备注:第10页更新了相对打分的解释,纠正了之前公式的错误。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
有问题请发贴提问
回复

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


 楼主| 发表于 2016.1.7 09:20:38 | 显示全部楼层
问16:增强子结合区域是1甲基化,但是增强子也属于TF,那么3甲基化也不是肯定的么?
答:增强子未必是转录因子结合区域,比如enhancer RNA,结合的蛋白类型更转录因子结合的区域还是有区别的,两者是不一样的。


问17:正义链和反义链是什么意思?启动子区域在不同链怎么找?

答:比如人类基因组里面,正义链已经被人为定义好了,某一条链是正链,某一条即为反链。那具体到基因的话,我们知道RNA的转录是单链转录的,转录有可能转录正义链也有可能转录反义链,所以启动子肯定是跟你的转录链在同一条链的。所以启动子不可能在反义链上,这里的得反义链是DNA的反义链,但你的转录本就在反义链上所以启动子区域通常跟你的转录连在同一条链上。


问18:正向转录和反向转录找启动子区域有什么不同呢?
答:没有什么不同。


问19:染色体的正负链,跟 DNA模板的正负链不一样吗?
答:正向的话,位于我们染色体位置信息中数字比较小减去2K;反向的话,在染色体位置信息中数字比较大的加上2K。
问:可以举个例子吗?
答:转录因子是结合启动子区域,起始转录;而小RNA一般是靶向拮抗转录本的表达。


问20:预测某个基因的启动子序列,应该使用正义链的序列(与mRNA一致)吧?
答:是的。


问21:转录因子为什么允许错配呢?
答:转录因子结合规律类似于microRNA跟靶基因的结合。就是说这些结合本身有一种互补配对能量的问题,就是吉布斯自由能。如果一个转录因子蛋白的某些序列,因为蛋白序列有某些特性,就是说跟正靶向结合时候,他的结合能力是下降的。在任何一个转录因子,他可能一两个模型,可能允许错配2个地方, 有可能错配3个地方,这些模型允许错配,我们就来统计这些基因存在哪些错位位点,所以,我们就可以把转录因子的结合模型总结出来。
你再给一条序列,那么可以根据这个完美模型来判定这个错配会导致能量下降多少,如果能量为100%的话,我们认为能量讲到80%的时候就能结合了,但这80%也是人为定的标准,比如你觉得80%太严了,你可以降到70%也许是OK的。但这也是一种经验性的标准。


问22:promo网站输入启动子序列,就会显示能够结合的位点以及相应的转录因子,跟JASPAR网站方法什么区别?
答:建议看下promo网站的方法学文章,无论是什么数据库,大部分转录因子预测的都是用这种方法的。可能方法有优化但不会相差太多。


问23:我用人的序列去比对另一物种的基因组,然后用genewise去预测ORF,得到的预测结果中发现同一条人的query序列对应上了另一物种多个scaffold,但是score值不同,这些score值怎么处理?
答:比对劫到多个地方这种情况是正常的,比如如果基因存在基因家族,然后一个基因也不一定在基因组上就一个拷贝,所以就能比对到多个scaffold,所以导致score不同。


问24:转录因子和小RNA的作用方式有什么区别?他们都是起到调控作用?
答:转录因子是一个转录前调控,决定了这个基因能否被转录;小RNA是一种转录后调控,他的转录已经翻译出来的,但是来阻止他翻译成蛋白,比如可以利用小RNA来结合,或使RNA降解。所以转录因子是一个转录前调控,小RNA是一种转录后调控是否翻译成蛋白,这是两者的根本区别。


问25:TFBS模型构建有什么意义?
答:目前TFBS大部分实验来源于ChIP 及传统的凝胶迁移实验等,凝胶迁移实验以前传统做法是获得一个转录因子,就在体外将转录因子与DNA打碎结合,结合后跑电泳看看哪些DNA是跟转录因子蛋白一起迁移的,然后把一起迁移的DNA拿出来去测序,当然可能会测个百八十条,这些序列都是不一样的,但是这些序列虽然不一样,但肯定都有转录因子的结合位点。所以就需要把这些结合规律找出来。比如可以统计每个区域剪辑的频率,建立转录因子这样一个模型。

模型构建有什么好处呢?如果后面再获得一个基因,想看它到底能不能跟转录因子结合,你就可以在基因的上游去找到有没有符合这个模型的序列,如果有这样序列,那么就可以判断可以与转录因子结合。

引申一点,我们测出来的区域二三百长,但实际上结合区域只有4-10个bp,一般通过序列分析软件比如MEME,找出最保守的区域。找出来以后再通过统计,把最保守的区域可视化,画成序列logo等这样的图片。


问26:TF的结合能力的不同,也可视为一种表达调控吗?
答:结合能力只是结合的一部分,还要涉及到很多因素,如转录因子的表达量。表达量越高,调控的强度越大,还有转录因子的调控受到很多伴侣分子、其他跟它共调控的转录因子的作用。所以,转录调控不是单一由结合能力来决定的,还有其他一些干扰。TF本身也不是单独发挥作用的,还有分子伴侣等的协助过程,这就是属于一种共调控的过程。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
有问题请发贴提问
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


 楼主| 发表于 2016.1.7 09:26:34 | 显示全部楼层
问27:未知蛋白怎么分析它是否为转录因子?有没有软件分析蛋白功能结构域?
答:有两个方法:1、无论动物植物都有转录因子数据库,如果拿到一个未知转录蛋白不知道他是否为转录因子,可以跟数据库进行比对,看看他能不能跟其他蛋白同源的。之前我们微信也分享过相关文章:http://mp.weixin.qq.com/s?__biz=MzA5NzQzOTgzMw==&mid=400490670&idx=1&sn=ec473f63741dae4a93599d9565c550bc#rd


另外也可以跟pfam数据库比对,看看有没有一些典型的转录因子的保守域,这些结构域和同源比对都是可以帮助你判断一个蛋白是否为转录因子的。


问28:新基因怎么判断它是否为转录因子?
答:新基因如果是跟任何蛋白都没有同源的话,那么这个是比较难判断转录因子的。


问29:非模式可以做ChIP吗?
答:非模式生物做ChIP没有特别好的方法, 如果非要做东西的话那么可以做基因共表达。比如计算不同基因的表达量相关系数,挑选出共表达的基因,处于共表达核心部分的基因,就有可能是TF,当然,还要看这个基因的blast比对注释信息。


问30:现在做小RNA跟他靶基因切割位点,然后可以干嘛用?
答:研究小RNA对靶基因的调控机制,有剪切和沉默两种。


问31:对于未知基因组,可以预测靶基因位点吗?
答:没有基因组信息,序列都不知道怎么预测。


问32:如何从一个转录组数据里面找一些基因的系列设计引物克隆CDS?
答:无参考基因组的de novo结果在组装文件夹里面的fa文件里面有序列信息;有参的通过基因id直接在NCBI等网站上搜索序列信息。


问33:enhancer RNA是怎么去定义,用GRO-seq的数据么?
答:本质是lncRNA,但是其被转录后可以调控增强上下游蛋白编码基因的表达。


问34:一个基因有好几个CDS,而且同源性特高,怎么分开?
答:需要去找特异引物。
问:就几个基因的差异,没法找特异性引物,是不是在做 QPCR的时候没法做?
答:几个碱基,也可以设计特异引物。一个碱基就足够了。差异碱基要卡在引物的3'端最后一个碱基。
有问题请发贴提问
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.3.16
在线时间
2 小时

发表于 2016.3.16 17:51:58 | 显示全部楼层

谢谢 非常有帮助
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.4.7
在线时间
5 小时

发表于 2016.4.7 20:10:00 | 显示全部楼层
讲解的真详细,赞一个

点评

哈哈,此赞不能取消~  发表于 2016.4.8 09:21
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
26
注册时间
2016.1.13
在线时间
257 小时

突出贡献优秀版主


发表于 2016.4.8 20:43:32 | 显示全部楼层
真是越来越深奥了!看一遍根本不能笑话啊,必须收藏!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.30
在线时间
5 小时

发表于 2016.4.27 09:27:46 | 显示全部楼层
之前怎么没看到这个帖子。。。。亏大发了。。。。。小瑶,你的错啊
回复 支持 反对

使用道具 举报

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
422
注册时间
2015.11.23
在线时间
952 小时

宣传达人优秀版主


 楼主| 发表于 2016.4.27 09:34:44 | 显示全部楼层
北轩小陌 发表于 2016.4.27 09:27
之前怎么没看到这个帖子。。。。亏大发了。。。。。小瑶,你的错啊 ...

怪我咯 反正怪我咯
有问题请发贴提问
回复 支持 反对

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.5.3
在线时间
4 小时

发表于 2016.5.17 10:56:08 | 显示全部楼层
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2015.12.30
在线时间
5 小时

发表于 2016.5.19 09:31:31 | 显示全部楼层
越看越好。。。
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
注册时间
2016.5.19
在线时间
18 小时

发表于 2016.5.19 17:24:11 | 显示全部楼层
太感谢了!问题解答部分回答了我很多疑问,赞一个!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.6.6
在线时间
26 小时

发表于 2016.6.7 13:32:21 | 显示全部楼层
谢谢分享
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
1
注册时间
2016.5.20
在线时间
187 小时

发表于 2016.6.8 10:57:43 | 显示全部楼层
这个资源好啊 顶起
加油!中国!
回复 支持 反对

使用道具 举报

版主

Rank: 10Rank: 10Rank: 10

主题
34
注册时间
2016.5.11
在线时间
750 小时

活跃会员突出贡献


发表于 2016.6.13 14:33:17 | 显示全部楼层
很赞的分享
新的一天加油!
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2016.5.30
在线时间
14 小时

发表于 2016.6.16 21:18:22 | 显示全部楼层
优秀贴~~
回复

使用道具 举报

帝王蝶

Rank: 4

主题
1
注册时间
2016.5.16
在线时间
153 小时

发表于 2016.6.22 17:37:56 | 显示全部楼层
能分享下有用MEME软件分析的文章吗?
回复 支持 1 反对 0

使用道具 举报

帝王蝶

Rank: 4

主题
30
注册时间
2016.5.24
在线时间
270 小时

发表于 2016.6.27 17:41:03 | 显示全部楼层
值得学习
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.9.26
在线时间
0 小时

发表于 2016.9.26 22:21:18 | 显示全部楼层
太感谢了
回复

使用道具 举报

草履虫

Rank: 2

主题
0
注册时间
2016.9.30
在线时间
7 小时

发表于 2016.10.2 03:44:55 | 显示全部楼层
实用
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
6
注册时间
2016.8.29
在线时间
29 小时

发表于 2016.10.3 10:25:13 | 显示全部楼层
共表达网络是个很神奇的东西啊
然后呢,一起加油吧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表