马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
代码如下:
[Python] 纯文本查看 复制代码 import re
import sys
patG=re.compile(r'gene_id\s+"(.+?)";')
Gene=dict()
d=open(sys.argv[1],'r')
for each in d:
if each.startswith("#"):
continue
line=each.strip().split()
typ=line[2]
if typ != "exon":
continue
start=line[3]
end=line[4]
each_len=int(end)-int(start)+1
mgene=patG.search(each)
geneName=mgene.groups()[0]
Gene.setdefault(geneName,[]).append(each_len)
for each in Gene:
print(f'{each}\t{sum(Gene[each])}')
|