难以替换的正则表达式Javascript副本

难以替换的正则表达式Javascript副本,javascript,regex,Javascript,Regex,我希望有人能帮助我。我需要创建一个正则表达式,该正则表达式将删除输入文件中的所有重复项-我正在创建一个ftp.exe脚本以上载文件,并且不希望在execute命令中出现重复项 下面是一个简短的脚本示例:文件中可能有多达20个或更多相同的副本 我已经创建了(围绕不同部分的括号),并认为它可能用于分组 (mkdir /breeds cd /breeds mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\s

我希望有人能帮助我。我需要创建一个正则表达式,该正则表达式将删除输入文件中的所有重复项-我正在创建一个ftp.exe脚本以上载文件,并且不希望在execute命令中出现重复项

下面是一个简短的脚本示例:文件中可能有多达20个或更多相同的副本

我已经创建了
围绕不同部分的括号
,并认为它可能用于分组

    (mkdir /breeds
    cd /breeds
    mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/breeds/*.*
    )
(mkdir /breeds
    cd /breeds
    mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/breeds/*.*
    )
(cd /
    mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/*.*
    )
(cd /
    mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/*.*
    )

如何编写javascript regex.match来提取重复值。

虽然识别文本中的重复项对人来说非常容易,但对regex来说这是一项相当困难的任务(特别是因为文本似乎可以是任何内容,并且没有固定数量的行组成一个组)

考虑:

mkdir /breeds
cd /breeds
mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/breeds/*.*

这会造成重复吗?每个组的前两行是否重复,或者整个组是否需要匹配(但在这种情况下,如何确定组?)

你不会找到一个正则表达式来完成你想在这里做的事情。您需要找到一种方法,根据您提供的一系列规则来实际解析您的输入


例如,您可以将输入拆分为一个数组行,然后双重遍历该数组以查找相等的行组(但即使这样,您也需要确定一些规则,例如组成一个组的最小行数)。

一种方法是将每个“组”合并为一行(例如,用分号分隔命令),然后使用unix
| sort | uniq
删除重复的行,然后再次拆分行。

OP希望在Javascript中执行此操作,但看起来他无论如何都不会使用unix(“ftp.exe”)我本来想把它写到mysql上,然后按函数分组——但我认为正则表达式可能更简单、更快…@Daniel说得好。我想我应该更仔细地阅读这个问题。不过,现在还没有js解决方案,有时候用你没有想到的方法来解决这个问题会很有帮助。问题D的分解得不错aniel…正如我在下面提到的,可能更容易将其临时写入mysql,然后进行分组,然后删除临时文件?我正在使用aspOk,我已经完成了,它似乎可以工作我正在(括号)之间编写所有内容到mysql数据库-然后用group by语句再次导入,该语句过滤掉所有重复项…这不是最优雅、最快的方法,但它似乎工作正常我已经完成了,而且似乎工作正常我正在(括号)之间编写所有内容到mysql数据库-然后用group by语句再次导入它,该语句过滤掉所有重复项…这不是最优雅、最快的方法,但它似乎可以工作
mkdir /breeds
cd /breeds
mput C:\Inetpub\wwwroot\site.co.za/admin/buckets\application\sites\site_-_org/*.*