通过shell脚本在csv中查找重复记录（Ubuntu）_Csv_Awk

通过shell脚本在csv中查找重复记录（Ubuntu）

csv awk

通过shell脚本在csv中查找重复记录（Ubuntu）,csv,awk,Csv,Awk,我有下面的csv name,mobile name1,123456 name2,98765 name1,123456 name3,98765 name1,123456 name4,344545443 如果有两条记录移动，则该记录将被视为重复记录。但在打印重复记录时，必须忽略第一条记录所以我的输出应该是这样的 name,mobile name1,123456 name1,123456 name2,98765 所以这里123456在我的文件中是3次，但我只想打印两次，因为第一次出现是唯一的，所

我有下面的csv

name,mobile
name1,123456
name2,98765
name1,123456
name3,98765
name1,123456
name4,344545443

如果有两条记录移动，则该记录将被视为重复记录。但在打印重复记录时，必须忽略第一条记录

所以我的输出应该是这样的

name,mobile
name1,123456
name1,123456
name2,98765

所以这里123456在我的文件中是3次，但我只想打印两次，因为第一次出现是唯一的，所有其他出现是重复的

我试过了

awk -F, 'NR==FNR {++A[$2]; next} A[$2]>1'  file1.csv file1.csv

它给了我

name1,123456
name2,98765
name1,123456
name3,98765
name1,123456

它并没有忽略第一个事件

请在这方面帮助我

因为我理解您的问题，您希望输出第二个字段至少出现两次的记录，但不输出第一个实例

awk -F, '++seen[$2] > 1' file

根据您的样本数据，此打印

name1,123456
name3,98765
name1,123456

这是输入数据的第4、5、6行。

@NicoHaase awk-F，'NR==FNR{++A[$2]；next}A[$2]>1'file1.csv file1.csv这并没有忽略第一次发生在“name3”和“name4”上的情况在您的输出中？@glennjackman通过使用上面的脚本，我得到了以下输出名称1123456名称298765名称1123456名称398765名称1，123456@NicoHaase我已经更新了我的问题。请看一看，帮我摆脱它