楼主: johnlcd

[转录组] 转录组组装新方法 - HISAT, StringTie and Ballgown

  [复制链接]

帝王蝶

Rank: 4

主题
3
奥币
1130
积分
206
注册时间
2016.3.16
在线时间
39 小时

 楼主| 发表于 2016.11.2 22:30:53 | 显示全部楼层
本帖最后由 johnlcd 于 2016.12.22 15:59 编辑

鉴于之前很多同胞不清楚Phenotype_data的样子,找了之后发现有文章所有测试数据的链接,还有脚本文件,特此分享,帮助各位理解及测试程序。
ftp://ftp.ccb.jhu.edu/pub/RNAseq_protocol/


之前做了一个PPT总结了文章的一些内容,分享下,希望对大家的分析有所帮助。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
奥币
801
积分
122
注册时间
2016.5.20
在线时间
47 小时

发表于 2016.11.3 10:23:22 | 显示全部楼层
johnlcd 发表于 2016.11.2 22:30
鉴于之前很多同胞不清楚Phenotype_data的样子,找了之后发现有文章所有测试数据的链接,还有脚本文件,特此 ...

能不能直接张贴出Phenotype_data的样子来看看?因为原文章给的好像并不是有重复样本,而是多个不同样本的情况。
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
3
奥币
1130
积分
206
注册时间
2016.3.16
在线时间
39 小时

 楼主| 发表于 2016.11.3 21:45:33 | 显示全部楼层
本帖最后由 johnlcd 于 2016.11.3 21:51 编辑
naturehunger 发表于 2016.11.3 10:23
能不能直接张贴出Phenotype_data的样子来看看?因为原文章给的好像并不是有重复样本,而是多个不同样本的 ...

数据链接都发了,方便的话自己下下来看一下就很清楚了

geuvadis_phenodata.csv:
"ids","sex","population"
"ERR188044","male","YRI"
"ERR188104","male","YRI"
"ERR188234","female","YRI"
"ERR188245","female","GBR"
"ERR188257","male","GBR"
"ERR188273","female","YRI"
"ERR188337","female","GBR"
"ERR188383","male","GBR"
"ERR188401","male","GBR"
"ERR188428","female","GBR"
"ERR188454","male","YRI"
"ERR204916","female","YRI"


表型文件,其实就是为了记录sample的信息,以便差异表达的时候进行分组,不管是.csv或是.txt文件都是一样,只要用R读进去就行。。
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
奥币
801
积分
122
注册时间
2016.5.20
在线时间
47 小时

发表于 2016.11.4 10:14:06 | 显示全部楼层
谢谢,我在仔细看看文章,从这个文件我得到的信息是这样,sex和population来共同定义一种condition,相同condition下,不同ids即为重复样本?还是不同ids为不同样本,他们各自都没有重复样本。
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
3
奥币
1130
积分
206
注册时间
2016.3.16
在线时间
39 小时

 楼主| 发表于 2016.11.4 23:02:20 | 显示全部楼层
sex和population当然是分开的,考虑其中一种表型不同condition的时候,另外一种变量要校正的,文章有提到correct,就指的是这个,有时候也叫协变量校正
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
3
奥币
1130
积分
206
注册时间
2016.3.16
在线时间
39 小时

 楼主| 发表于 2016.11.4 23:06:03 | 显示全部楼层
文章脚本里面有一个小问题,“library(RSkittleBrewer)”会报错,“RSkittleBrewer”这个包链接不可用,暂时没法安装,不过好像影响不大,这个包是画图时调色的
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
4
奥币
848
积分
396
注册时间
2016.7.15
在线时间
36 小时

发表于 2016.11.8 14:38:08 | 显示全部楼层
感谢感谢~~
回复

使用道具 举报

帝王蝶

Rank: 4

主题
1
奥币
548
积分
235
注册时间
2016.5.31
在线时间
81 小时

发表于 2016.11.9 18:24:52 | 显示全部楼层
先谢楼主分享
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
1
奥币
403
积分
94
注册时间
2016.11.9
在线时间
24 小时

发表于 2016.11.12 09:41:21 | 显示全部楼层
干货啊!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
2
奥币
197
积分
59
注册时间
2016.11.14
在线时间
21 小时

发表于 2016.11.18 14:45:08 | 显示全部楼层
现在用的多还是tophat-cufflink那一套吧
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
3
奥币
1130
积分
206
注册时间
2016.3.16
在线时间
39 小时

 楼主| 发表于 2016.11.18 23:52:51 | 显示全部楼层
antiroger 发表于 2016.11.18 14:45
现在用的多还是tophat-cufflink那一套吧

HISAT是tophat替代品,tophat假阳性高,而且HISAT的速度比tophat快几十倍。。
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
2
奥币
458
积分
88
注册时间
2016.11.14
在线时间
37 小时

发表于 2016.11.22 16:13:37 | 显示全部楼层
hisat2+stringtie的rsem相比,两者各有什么特点啊?
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
奥币
722
积分
169
注册时间
2016.3.14
在线时间
77 小时

发表于 2017.1.5 21:35:15 | 显示全部楼层
牛牪犇~~~~~~
回复

使用道具 举报

帝王蝶

Rank: 4

主题
6
奥币
701
积分
360
注册时间
2016.5.22
在线时间
78 小时

发表于 2017.1.6 18:10:00 | 显示全部楼层
非常感谢
回复

使用道具 举报

帝王蝶

Rank: 4

主题
6
奥币
701
积分
360
注册时间
2016.5.22
在线时间
78 小时

发表于 2017.1.6 18:35:41 | 显示全部楼层
非常好
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
6
奥币
549
积分
199
注册时间
2016.4.7
在线时间
29 小时

发表于 2017.1.11 15:54:25 | 显示全部楼层
不错,很有用啊
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
奥币
722
积分
169
注册时间
2016.3.14
在线时间
77 小时

发表于 2017.1.12 16:05:02 | 显示全部楼层
楼主请教一下,我看文章里面说,三个重复才有统计学意义。For each condition, we include six replicates, noting that three is the minimum number of replicates for valid statistical results.

但是因为早期经费和样品的限制,只有两个生物学重复,可以用这套流程分析吗?我大概跑了一下,居然没有一个Q值显著的基因,而且基因名字应该怎么和参考基因组注释文件中基因名字 对应上呢?

求指点迷津,求指导。非常感谢~
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
奥币
316
积分
74
注册时间
2016.3.30
在线时间
52 小时

发表于 2017.1.13 10:07:23 | 显示全部楼层
赞赞!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
6
奥币
924
积分
94
注册时间
2016.3.15
在线时间
47 小时

发表于 2017.2.17 21:52:59 | 显示全部楼层
转录组mapping用的基因组需不需要mask掉重复序列
回复 支持 反对

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
奥币
722
积分
169
注册时间
2016.3.14
在线时间
77 小时

发表于 2017.3.16 13:10:50 | 显示全部楼层
北极燕鸥 发表于 2017.1.12 16:05
楼主请教一下,我看文章里面说,三个重复才有统计学意义。For each condition, we include six replicates, ...

@周老师
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表