问16:增强子结合区域是1甲基化,但是增强子也属于TF,那么3甲基化也不是肯定的么? 答:增强子未必是转录因子结合区域,比如enhancer RNA,结合的蛋白类型更转录因子结合的区域还是有区别的,两者是不一样的。
问17:正义链和反义链是什么意思?启动子区域在不同链怎么找?
答:比如人类基因组里面,正义链已经被人为定义好了,某一条链是正链,某一条即为反链。那具体到基因的话,我们知道RNA的转录是单链转录的,转录有可能转录正义链也有可能转录反义链,所以启动子肯定是跟你的转录链在同一条链的。所以启动子不可能在反义链上,这里的得反义链是DNA的反义链,但你的转录本就在反义链上所以启动子区域通常跟你的转录连在同一条链上。
问18:正向转录和反向转录找启动子区域有什么不同呢? 答:没有什么不同。
问19:染色体的正负链,跟 DNA模板的正负链不一样吗? 答:正向的话,位于我们染色体位置信息中数字比较小减去2K;反向的话,在染色体位置信息中数字比较大的加上2K。 问:可以举个例子吗? 答:转录因子是结合启动子区域,起始转录;而小RNA一般是靶向拮抗转录本的表达。
问20:预测某个基因的启动子序列,应该使用正义链的序列(与mRNA一致)吧? 答:是的。
问21:转录因子为什么允许错配呢? 答:转录因子结合规律类似于microRNA跟靶基因的结合。就是说这些结合本身有一种互补配对能量的问题,就是吉布斯自由能。如果一个转录因子蛋白的某些序列,因为蛋白序列有某些特性,就是说跟正靶向结合时候,他的结合能力是下降的。在任何一个转录因子,他可能一两个模型,可能允许错配2个地方, 有可能错配3个地方,这些模型允许错配,我们就来统计这些基因存在哪些错位位点,所以,我们就可以把转录因子的结合模型总结出来。 你再给一条序列,那么可以根据这个完美模型来判定这个错配会导致能量下降多少,如果能量为100%的话,我们认为能量讲到80%的时候就能结合了,但这80%也是人为定的标准,比如你觉得80%太严了,你可以降到70%也许是OK的。但这也是一种经验性的标准。
问22:promo网站输入启动子序列,就会显示能够结合的位点以及相应的转录因子,跟JASPAR网站方法什么区别? 答:建议看下promo网站的方法学文章,无论是什么数据库,大部分转录因子预测的都是用这种方法的。可能方法有优化但不会相差太多。
问23:我用人的序列去比对另一物种的基因组,然后用genewise去预测ORF,得到的预测结果中发现同一条人的query序列对应上了另一物种多个scaffold,但是score值不同,这些score值怎么处理? 答:比对劫到多个地方这种情况是正常的,比如如果基因存在基因家族,然后一个基因也不一定在基因组上就一个拷贝,所以就能比对到多个scaffold,所以导致score不同。
问24:转录因子和小RNA的作用方式有什么区别?他们都是起到调控作用? 答:转录因子是一个转录前调控,决定了这个基因能否被转录;小RNA是一种转录后调控,他的转录已经翻译出来的,但是来阻止他翻译成蛋白,比如可以利用小RNA来结合,或使RNA降解。所以转录因子是一个转录前调控,小RNA是一种转录后调控是否翻译成蛋白,这是两者的根本区别。
问25:TFBS模型构建有什么意义? 答:目前TFBS大部分实验来源于ChIP 及传统的凝胶迁移实验等,凝胶迁移实验以前传统做法是获得一个转录因子,就在体外将转录因子与DNA打碎结合,结合后跑电泳看看哪些DNA是跟转录因子蛋白一起迁移的,然后把一起迁移的DNA拿出来去测序,当然可能会测个百八十条,这些序列都是不一样的,但是这些序列虽然不一样,但肯定都有转录因子的结合位点。所以就需要把这些结合规律找出来。比如可以统计每个区域剪辑的频率,建立转录因子这样一个模型。
模型构建有什么好处呢?如果后面再获得一个基因,想看它到底能不能跟转录因子结合,你就可以在基因的上游去找到有没有符合这个模型的序列,如果有这样序列,那么就可以判断可以与转录因子结合。
引申一点,我们测出来的区域二三百长,但实际上结合区域只有4-10个bp,一般通过序列分析软件比如MEME,找出最保守的区域。找出来以后再通过统计,把最保守的区域可视化,画成序列logo等这样的图片。
问26:TF的结合能力的不同,也可视为一种表达调控吗? 答:结合能力只是结合的一部分,还要涉及到很多因素,如转录因子的表达量。表达量越高,调控的强度越大,还有转录因子的调控受到很多伴侣分子、其他跟它共调控的转录因子的作用。所以,转录调控不是单一由结合能力来决定的,还有其他一些干扰。TF本身也不是单独发挥作用的,还有分子伴侣等的协助过程,这就是属于一种共调控的过程。
|