两表格合并






选择文件 *

选择文件 *


  任务完成后发邮件通知我

 使用一次消耗奥币数 0



功能:
把两个表格合并为一个表格。按内连接、左连接、右连接、全连接四种方式,将两个表格的信息根据需求合并到一个表格中。


输入:
从本地或者云空间,选择两个拥有表头的数据文件,且表头位于第一行。数据与数据间以制表符分开(Tab键)


参数:
连接方式有:内连接、左连接、右连接、全连接四种

①内连接:将两个表的共有ID或共有名称的所有行合并输出;

②左连接:利用共有ID或共有名称,以左边表中的数据为基准,来提取右表的数据,若右表无相应数据则相应位置为空值;

③右连接:利用共有ID或共有名称,以右边表中的数据为基准,来提取左表的数据,若左表无相应数据则相应位置为空值;

④全连接:利用共有ID或共有名称,合并两个表,若有共有行ID或者共有名称则合并一行输出,无则分别输出。

⑤缺省值:没有对应的值用于填充的字符:——、X、N/A、空,也可自填缺省值。


输出:
程序将以txt的形式输出结果文档,第一行为表头数据

示例文件(可右击下载:)文件1  文件2

现有两个表格,表格A是基因表达量的信息,表格B是基因的注释信息。其中两个表格第一列均为基因ID,我们可以通过表格合并,将表达量信息和注释信息合并为一个表格。


表格1:
geneID root_exp leave_exp
Unigene01 16.4798 3.3122
Unigene02 44.5027 24.1932
Unigene03 86.9566 43.0663
表格2:
geneID KO_id ko_definition
Unigene02 K10592 E3 ubiquitin-protein ligase HUWE1
Unigene03 K10592 NADH dehydrogenase I subunit 4
Unigene04 K05579 dehydrogenase I subunit 7
生物云平台
内连接结果:
geneID root_exp leave_exp KO_id ko_definition
Unigene02 44.5027 24.1932 K10592 E3 ubiquitin-protein ligase HUWE1
Unigene03 86.9566 43.0663 K10592 NADH dehydrogenase I subunit 4
左连接结果:
geneID root_exp leave_exp KO_id ko_definition
Unigene01 16.4798 3.3122 -- --
Unigene02 44.5027 24.1932 K10592 E3 ubiquitin-protein ligase HUWE1
Unigene03 86.9566 43.0663 K10592 NADH dehydrogenase I subunit 4
右连接结果:
geneID root_exp leave_exp KO_id ko_definition
Unigene02 44.5027 24.1932 K10592 E3 ubiquitin-protein ligase HUWE1
Unigene03 86.9566 43.0663 K10592 NADH dehydrogenase I subunit 4
Unigene04 -- -- K05579 dehydrogenase I subunit 7
全连接结果:
geneID root_exp leave_exp KO_id ko_definition
Unigene01 16.4798 3.3122 -- --
Unigene02 44.5027 24.1932 K10592 E3 ubiquitin-protein ligase HUWE1
Unigene03 86.9566 43.0663 K10592 NADH dehydrogenase I subunit 4
Unigene04 -- -- K05579 dehydrogenase I subunit 7