比较python中两个未排序文件的列…需要特定的输出
我有两个大数据的管道分隔文件…需要比较它们的列..I列是主键 例如。 1.dat 2.dat比较python中两个未排序文件的列…需要特定的输出,python,Python,我有两个大数据的管道分隔文件…需要比较它们的列..I列是主键 例如。 1.dat 2.dat 569|NY|A+|500 777|OK|A|350 899|OK|B|150 输出应如下所示: NY column3 1 NY column4 1 OK column3 2 OK column3 2 这意味着纽约唱片公司。。。第三列对于匹配的记录有一个差异。对于OK记录…第三列对于匹配的记录有两个差异 我想连接我的主键i列上的两个文件,然后比较它们的列 请帮助我:)如果文件已排序,如您所示
569|NY|A+|500
777|OK|A|350
899|OK|B|150
输出应如下所示:
NY column3 1
NY column4 1
OK column3 2
OK column3 2
这意味着纽约唱片公司。。。第三列对于匹配的记录有一个差异。对于OK记录…第三列对于匹配的记录有两个差异
我想连接我的主键i列上的两个文件,然后比较它们的列
请帮助我:)如果文件已排序,如您所示,您可以使用类似于合并排序的合并阶段的方式进行排序:
NY column3 1
NY column4 1
OK column3 2
OK column3 2