python中的文件解析-删除重复项并获取要重新排列的重复项索引

python中的文件解析-删除重复项并获取要重新排列的重复项索引,python,Python,我有一个包含一些副本的文件,我想找到副本并写入另一个文件,其中副本被分组在一起,前面的行被重新排列。行是以2为一组的,所以如果在第2行和第10行中有重复项,我就去掉了第2行 line 1= "string1" line2 (possibly_common_string) or string 2 .... line9 string9 line10 (possibly_common_string) or string 110 如果没有重复项,我希望按原样写入,如果有重复项,我希望按原样写入另一

我有一个包含一些副本的文件,我想找到副本并写入另一个文件,其中副本被分组在一起,前面的行被重新排列。行是以2为一组的,所以如果在第2行和第10行中有重复项,我就去掉了第2行

line 1= "string1"
line2 (possibly_common_string)  or string 2
....
line9 string9 
line10 (possibly_common_string) or string 110
如果没有重复项,我希望按原样写入,如果有重复项,我希望按原样写入另一个文件-

line1 = string1
line2= common string- this was string in line 2. Old line 10 deleted.
line3= string 9 -> line 9 moved up.
line4= old line 5. 
我正在考虑读取整个文件,寻找副本,但是类似这样的东西会丢失副本,而不给我从中移动的索引


我可以获取重复行的索引吗

为什么要在输出中向上移动第9行?它与重复的第10行相关联。文件中的所有行都以2为一组进行测量。这太令人困惑了,你能给出一个完整的输入和输出示例,包括所有可能的角情况(例如,一对中的第1行是另一对中的第2行的副本,两条第2行都是副本,文件中有3个副本,等等)。我刚刚解决了它,我想,将在几个小时内发布解决方案。谢谢