List 合并列表问题

List 合并列表问题,list,command-line,batch-file,List,Command Line,Batch File,抱歉标题不好,但问题不容易压缩成一句话 我有两个contigs列表(列表1和列表2)。它们大多包含独特的重叠群,但有一些重叠。我想比较list1和list2,然后创建一个list3,其中包含list1中的所有重叠,减去list2中也存在的重叠。使用简单的cat/paste/grep/sort/uniq类批处理命令是否可以实现这一点 谢谢 看看Iesi.Collections库,也请参考Codeproject上的文章 看看Iesi.Collections库,也请参阅Codeproject上的文章

抱歉标题不好,但问题不容易压缩成一句话

我有两个contigs列表(列表1和列表2)。它们大多包含独特的重叠群,但有一些重叠。我想比较list1和list2,然后创建一个list3,其中包含list1中的所有重叠,减去list2中也存在的重叠。使用简单的cat/paste/grep/sort/uniq类批处理命令是否可以实现这一点


谢谢

看看Iesi.Collections库,也请参考Codeproject上的文章

看看Iesi.Collections库,也请参阅Codeproject上的文章

您可以使用
排序
uniq
来执行此操作:

sort list1 list2 list2 | uniq -u 

列表2中的任何行都将在已排序的输出中至少出现两次,因此将由uniq筛选器进行筛选。您可以使用
排序
uniq

sort list1 list2 list2 | uniq -u 

列表2中的任何行都将在排序后的输出中至少出现两次,因此将被uniq过滤器过滤

try
comm-23

示例(第一个列表:数字1-10,第二个列表包含数字5-8)


comm-23try
comm-23

示例(第一个列表:数字1-10,第二个列表包含数字5-8)


comm-23您没有显示有关列表的任何示例数据,所以我编造了它。假定

$ cat file1
11
12
5
13
7
14
15

$ cat file2
6
7
8
5
4
1

$ awk 'FNR==NR { a[$0]; next } (! ($0 in a) ) ' file2 file1
11
12
13
14
15

如果这不是您想要的,请用列表和所需输出的示例更清楚地描述您的列表。

您没有显示关于列表的任何示例数据,因此我编造了它。假定

$ cat file1
11
12
5
13
7
14
15

$ cat file2
6
7
8
5
4
1

$ awk 'FNR==NR { a[$0]; next } (! ($0 in a) ) ' file2 file1
11
12
13
14
15

如果这不是你想要的,请用你的清单和你想要的结果的例子更清楚地描述一下。我也从事生物信息学和基因组学的工作

如果您真的想得到uniq contig序列,最好使用python或perl来解决重叠/不匹配线程的问题


来自中国深圳BGI的GentleYang:)

我也从事生物信息学和基因组学工作

如果您真的想得到uniq contig序列,最好使用python或perl来解决重叠/不匹配线程的问题


作者:BGI深圳分公司的GentleYang:)

谢谢!其他的可能也会起作用,但这对我的数据集起到了作用。:)谢谢其他的可能也会起作用,但这对我的数据集起到了作用。:)