通过shell脚本在csv中查找重复记录(Ubuntu)

通过shell脚本在csv中查找重复记录(Ubuntu),csv,awk,Csv,Awk,我有下面的csv name,mobile name1,123456 name2,98765 name1,123456 name3,98765 name1,123456 name4,344545443 如果有两条记录移动,则该记录将被视为重复记录。但在打印重复记录时,必须忽略第一条记录 所以我的输出应该是这样的 name,mobile name1,123456 name1,123456 name2,98765 所以这里123456在我的文件中是3次,但我只想打印两次,因为第一次出现是唯一的,所

我有下面的csv

name,mobile
name1,123456
name2,98765
name1,123456
name3,98765
name1,123456
name4,344545443
如果有两条记录移动,则该记录将被视为重复记录。但在打印重复记录时,必须忽略第一条记录

所以我的输出应该是这样的

name,mobile
name1,123456
name1,123456
name2,98765
所以这里123456在我的文件中是3次,但我只想打印两次,因为第一次出现是唯一的,所有其他出现是重复的

我试过了

awk -F, 'NR==FNR {++A[$2]; next} A[$2]>1'  file1.csv file1.csv
它给了我

name1,123456
name2,98765
name1,123456
name3,98765
name1,123456
它并没有忽略第一个事件


请在这方面帮助我

因为我理解您的问题,您希望输出第二个字段至少出现两次的记录,但不输出第一个实例

awk -F, '++seen[$2] > 1' file
根据您的样本数据,此打印

name1,123456
name3,98765
name1,123456

这是输入数据的第4、5、6行。

@NicoHaase awk-F,'NR==FNR{++A[$2];next}A[$2]>1'file1.csv file1.csv这并没有忽略第一次发生在“name3”和“name4”上的情况在您的输出中?@glennjackman通过使用上面的脚本,我得到了以下输出名称1123456名称298765名称1123456名称398765名称1,123456@NicoHaase我已经更新了我的问题。请看一看,帮我摆脱它