Regex-在href属性中查找并替换url

Regex-在href属性中查找并替换url,regex,csv,notepad++,xlsx,findandmodify,Regex,Csv,Notepad++,Xlsx,Findandmodify,我有一个xlsx/csv文件,我正试图用notepad++修改它的内容。 在href中正好有一个url。例: href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/7/7521_Datasheet--de.pdf"" href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/7609_Datasheet--de.pdf"" href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/6/

我有一个xlsx/csv文件,我正试图用notepad++修改它的内容。 在href中正好有一个url。例:

href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/7/7521_Datasheet--de.pdf""
href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/7609_Datasheet--de.pdf""
href=""/xs_db/DOKUMENT_DB/www/Datenblaetter/de/6/7981_Datasheet--de.pdf""
etc...
替换后,我希望它们看起来像这样:

href=""/docs/7521_Datasheet--de.pdf""
href=""/docs/7609_Datasheet--de.pdf""
href=""/docs/7981_Datasheet--de.pdf""
现在,我在find上有一个模式:

(?<=href=(""|''))[^"']+(?=(.pdf""|.pdf''))

(?您可以在正则表达式模式下尝试以下查找和替换操作:

查找:

^href=""/.*?(\d+_Datasheet.*\.pdf"")$
href=""/docs/$1
替换:

^href=""/.*?(\d+_Datasheet.*\.pdf"")$
href=""/docs/$1

请注意,如果find模式不能处理更多数据,它可能会变得更通用。但一般来说,我们需要一些具体的方法来确定您希望保留在匹配中的后缀的开头。如果我的答案不适用于您,请说明失败的地方,并提供允许识别后缀的逻辑

这里有一种方法可以将要替换的零件与路径/文档匹配

查找内容:

^href=["']+\K(/.*?)(?=/\d+_[\w-]+\.pdf["']+$)
/docs
替换为:

^href=["']+\K(/.*?)(?=/\d+_[\w-]+\.pdf["']+$)
/docs

搜索模式:正则表达式(最好选中“.matches new lines”)

这个
^
应该在替换中吗?