Notepad++ 删除后面带有随机文本的重复行

Notepad++ 删除后面带有随机文本的重复行,notepad++,Notepad++,我在记事本里有这样的文字++ Random Text Here:188.0.0.0 Random Text Here:188.0.3.0 Random Text Here:188.2.0.0 然而,结尾的一些数字是重复的,我想把它们去掉。例如: Random Text Here:188.0.3.0 Random Different Text Here:188.0.3.0 我将如何在弥撒中这样做,因为有数千行这样的文字?在记事本++中,我将尝试以下多步骤过程 (1) 使用正则表达式将所有行更改

我在记事本里有这样的文字++

Random Text Here:188.0.0.0
Random Text Here:188.0.3.0
Random Text Here:188.2.0.0
然而,结尾的一些数字是重复的,我想把它们去掉。例如:

Random Text Here:188.0.3.0
Random Different Text Here:188.0.3.0

我将如何在弥撒中这样做,因为有数千行这样的文字?

在记事本++中,我将尝试以下多步骤过程

(1) 使用正则表达式将所有行更改为将IP地址和固定文本放在前面,从
此处的随机文本:188.0.0.0
更改为
:188.0.0!!!此处为随机文本

(2) 使用TextFx对文件进行排序以删除重复项

(3) 使用正则表达式查找并删除重复项。这可能需要多次通过

(4) 使用正则表达式将文本按正确的顺序放回原处

(5) (可选)再次对文件进行排序

上述方法存在的问题:

(a) 首先为IP地址排序的“随机文本”将是保留的文本,而不是原始文件中的第一个

(b) 根据是否使用步骤(5),结果将按IP地址或随机文本排序

更详细地说:

(0)选择输入文件中未出现的字符或短字符串。我将使用

(1) 在文件上执行正则表达式替换(选中点与换行符不匹配)以将
^(.*)(:\d+\.\d+\.\d+\.\d+.\d+$
更改为
$2$1

(2) 使用TextFx对文件进行排序。指定sort unique可能有助于减少行数

(3) 在文件上执行正则表达式替换(选择点与换行符不匹配)以更改
^(:\d+\.\d+\.\d+\.\d+)!!(.*)\r\n\1.*$
$1$2
。当有多条线路具有相同的IP地址时,这将删除其中的一半。多次运行相同的替换,直到报告未进行任何更改。根据文件中的行尾,您可能需要更改
\r\n
部分

(4) 在文件上执行正则表达式替换(选择点与换行符不匹配)以更改
^(:\d+\.\d+\.\d+\.\d+)!!(.*)$
$2$1


(5) (可选)再次对文件排序。

在记事本++中,我将尝试以下多步骤过程

(1) 使用正则表达式将所有行更改为将IP地址和固定文本放在前面,从
此处的随机文本:188.0.0.0
更改为
:188.0.0!!!此处为随机文本

(2) 使用TextFx对文件进行排序以删除重复项

(3) 使用正则表达式查找并删除重复项。这可能需要多次通过

(4) 使用正则表达式将文本按正确的顺序放回原处

(5) (可选)再次对文件进行排序

上述方法存在的问题:

(a) 首先为IP地址排序的“随机文本”将是保留的文本,而不是原始文件中的第一个

(b) 根据是否使用步骤(5),结果将按IP地址或随机文本排序

更详细地说:

(0)选择输入文件中未出现的字符或短字符串。我将使用

(1) 在文件上执行正则表达式替换(选中点与换行符不匹配)以将
^(.*)(:\d+\.\d+\.\d+\.\d+.\d+$
更改为
$2$1

(2) 使用TextFx对文件进行排序。指定sort unique可能有助于减少行数

(3) 在文件上执行正则表达式替换(选择点与换行符不匹配)以更改
^(:\d+\.\d+\.\d+\.\d+)!!(.*)\r\n\1.*$
$1$2
。当有多条线路具有相同的IP地址时,这将删除其中的一半。多次运行相同的替换,直到报告未进行任何更改。根据文件中的行尾,您可能需要更改
\r\n
部分

(4) 在文件上执行正则表达式替换(选择点与换行符不匹配)以更改
^(:\d+\.\d+\.\d+\.\d+)!!(.*)$
$2$1


(5) (可选)再次对文件进行排序。

嗯,是否保留第二行?为什么不是第一个还是最后一个?此外,在您的示例中,不是复制数字,而是复制数字之前的文本(IP地址?)。你能澄清一下吗?你不能仅仅消除重复的数字——在我的观点中,分隔符(:)之前的文本和它之后的文本创建一个键,用于标识条目。仅当整条线与现有线重复时不考虑可能的时间戳,我会考虑删除它们。抱歉,应该解释得更好。IP是复制的,不是IP之前的文本。我想摆脱DuBLIDIP的IP,但是随机文本阻碍了我的工作。我想:这里的随机文本:1880.3.0随机的不同文本:1880.3.0到B。e左起:此处随机文本:188.0.3.0,因为第二行是相同的IP。您的问题是否得到了回答?如果是,请接受答案。如果不是,那么还需要什么?呃,您想保留第二行吗?为什么不保留第一行或最后一行?同样,在您的示例中,不是数字重复,而是数字前的文本(IP地址?)是。你能澄清一下吗?你不能仅仅消除重复的数字-在我的观点中,分隔符(:)之前和之后的文本创建一个键,用于标识条目。只有当整行与现有行重复时不考虑可能的时间戳,我会考虑删除它们。抱歉,应该解释得更好。IP是复制的,不是IP之前的文本。我想摆脱DuBLIDIP的IP,但是随机文本阻碍了我的工作。我想:这里的随机文本:1880.3.0随机的不同文本:1880.3.0到B。e左起:此处随机文本:188.0.3.0,因为第二个是相同的IP。您的问题是否已得到回答?如果是,则