在linux shell中,如何在两个文件的同一列中获得相同值的计数?

在linux shell中,如何在两个文件的同一列中获得相同值的计数?,linux,comparison,Linux,Comparison,如果您有两个相同制表符分隔格式的文件,并且您希望获得该列中有多少值在两个文件之间相同的计数,那么最好的方法是什么 例如: 我有五列制表符分隔的数据,第二列file1如下: 在文件2中的第2列是: 预期输出为3。取决于,您希望在值和计数之间建立映射,还是该值是输入之一 无论哪种方式,您都可以通过管道连接cat、cut、grep、wc-l来实现。请添加示例输入/输出。编辑:约翰,你对我来说太快了。你添加了示例输入,但没有输出。你对我来说太快了。现在一切都好了。你说预期产量是2。为什么?如果位置重要,

如果您有两个相同制表符分隔格式的文件,并且您希望获得该列中有多少值在两个文件之间相同的计数,那么最好的方法是什么

例如: 我有五列制表符分隔的数据,第二列file1如下:

在文件2中的第2列是:


预期输出为3。

取决于,您希望在值和计数之间建立映射,还是该值是输入之一


无论哪种方式,您都可以通过管道连接cat、cut、grep、wc-l来实现。请添加示例输入/输出。编辑:约翰,你对我来说太快了。你添加了示例输入,但没有输出。你对我来说太快了。现在一切都好了。你说预期产量是2。为什么?如果位置重要,则应为1。如果位置不重要,它应该是3。否?不需要在它们之间进行映射,这仅仅是两个值之间的计数。如果值A在文件1中总是出现两次,而值B在文件1中出现四次,会发生什么情况?您只需要在两个文件中最常出现的值的计数?它们在每个文件中只出现一次,这是给定的。最后我使用了
cut-f2 strain1.vcf strain2.vcf | grep-c-wFf strain1.vcf strain2.vcf
234839
349583
444995
694038
785948
123943
234839
338273
349583
785948