正确使用awk、sort和uniq
我正在处理一个大的(500MB+).csv文件。我想一页一页地打印出给定列的唯一值,以便查看正确使用awk、sort和uniq,awk,uniq,Awk,Uniq,我正在处理一个大的(500MB+).csv文件。我想一页一页地打印出给定列的唯一值,以便查看 awk F, '{print $}' sort | uniq 这将生成一个快速滚动列表,该列表将切掉我感兴趣的75%的值。尝试下面的awk命令,它将保持导出唯一on#1列的原始顺序(您可以轻松调整到其他列) 如果需要对结果进行排序,那么在awk之后添加sort命令,这将为您节省大量时间 awk -F, '!a[$1]++' file |sort 在排序之前,您似乎错过了“|”awk F,{prin
awk F, '{print $}' sort | uniq
这将生成一个快速滚动列表,该列表将切掉我感兴趣的75%的值。尝试下面的awk命令,它将保持导出唯一on#1列的原始顺序(您可以轻松调整到其他列) 如果需要对结果进行排序,那么在awk之后添加sort命令,这将为您节省大量时间
awk -F, '!a[$1]++' file |sort
在排序之前,您似乎错过了“|”<代码>awk F,{print$}| sort | uniq。此外,uniq的输出可能有多个屏幕。您可能需要添加“| more”以方便查看。如果(cough
>a_文件
cough)有某种方法可以将结果捕获到磁盘上……我认为您可以在awkawk-F”内部完成此操作,而不是在外部使用管道![$1]+{print |“sort”}文件
awk -F, '!a[$1]++' file |sort