String 如何使用记事本替换/删除html文件中的特定字符串++;?

String 如何使用记事本替换/删除html文件中的特定字符串++;?,string,firefox,replace,notepad++,bookmarks,String,Firefox,Replace,Notepad++,Bookmarks,我已经将我的书签从FF导出到一个html文件中,但它太大太复杂了,所以我需要删除其中的一些firefox行,使其更轻巧和简单 我可以替换记事本++中的基本内容,但我想我确实需要一些操作符,我不知道如何使它正常工作 例如,以下是文件中包含Logodesignlove链接的行: <A HREF="http://www.logodesignlove.com/" ADD_DATE="1256428672" LAST_MODIFIED="1256428672" ICON_URI="http://ww

我已经将我的书签从FF导出到一个html文件中,但它太大太复杂了,所以我需要删除其中的一些firefox行,使其更轻巧和简单

我可以替换记事本++中的基本内容,但我想我确实需要一些操作符,我不知道如何使它正常工作

例如,以下是文件中包含Logodesignlove链接的行:

<A HREF="http://www.logodesignlove.com/" ADD_DATE="1256428672" LAST_MODIFIED="1256428672" ICON_URI="http://www.logodesignlove.com/favicon.ico" ICON="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABAAAAAQCAYAAAAf8/9hAAABDUlEQVQ4jWNgGF7gy9a9iS88Yw4803F49a6oYfHn589FGRgYGD4vWZv70iX80HMrv9MfF6zMw6r5Q/ukjkcMUv+R8TNzn+sv/eNPoou/753ZhKL5x8OHSo/Y5P+gK8SFH3Io//j+7Jk8wum79scQqxmGv2zcFQM34Ouhk96kGvBp5cZUuAGfnz8Xfcil8otoA5hl//+8cU8PJRxeJxZtJtaAlz5xJxkYGBhRDPh1/77BQ26V7wQDkFPp+9crN02xRuWnxavL8RrAIvv/8+otWXgT0/vu6ZMfMclgtZmgZrhLlm9MfSKi/Rmm+bm517VvF69ZEKUZBr68fCn+oWNK68cpC+qePXvGRZJmUgAAVs4XULOHB/oAAAAASUVORK5CYII=">Logo Design Love</A>

我需要删除所有我不关心的标签,比如LAST_MODIFIED=“1256428672”、ICON_URI=“数字串”ICON=“字符串”等等。 当然,我需要删除列表中每个链接中的所有标签

所以我想使用“Find all tags LAST_MODIFIED=“anynumbers”之类的东西,然后用nothing替换它/删除它”——但它不起作用

例如它应该是什么样子:


到目前为止,由于Aleksandr,我删除了上次修改的日期行并添加了日期行。所以上次修改的=“d+”效果很好。但图标和图标仍然存在。我尝试了ICON=“\w+”-但不起作用。我想这和斜线有关

阅读正则表达式的使用(java正则表达式教程是一个很好的开始),并尝试一个在线正则表达式工具来帮助编写和测试正则表达式,例如下面的一个

例如,用regex
LAST\u MODIFIED=“\d+”


否则,您可能需要特定于XML的工具,甚至需要编写XSL。然而,我对此不太了解。

为什么要寻找你不想要的东西,当你更容易掌握你想要的东西并扔掉垃圾的时候

(<A HREF=".*?").*?(>.*?>)

代码经过编辑以适合记事本++现在我知道它不需要特殊字符转义。谢谢Aleksandr。

谢谢Aleksandr!它适用于上次修改和添加日期,但不适用于图标URI和图标。
\w+
匹配普通字母,而
+?
匹配所有字符(但非贪婪,因为贪婪地匹配所有字符只会匹配到结尾),您还可以将多个正则表达式与
组合(意思是“或”)因此,您可以在一个GO中替换所有内容。为什么有人对此投了反对票?请参阅我的回答中有关\w+的评论不起作用。图标线仍然存在。不过还是要谢谢你!是的,=不应该有\在他们前面<代码>(.*?>)
$1$2