使用正则表达式从html标记中提取双引号

使用正则表达式从html标记中提取双引号,html,regex,Html,Regex,我正在使用以下模式从网站中提取一些内容: ([^+]+) 它输出 < img src=""http://www."" border=""0""/> 用双引号。我的查询有什么问题?只有在修改regexp时,您的问题才有意义 但首先,要注意: 一般来说,使用正则表达式实现的目标是不可行的。他们是做这件事的不合适的工具。使用正则表达式,您不会得到100%正确的解决方案 话虽如此,请尝试将[^+]+替换为[^。请注意,此正则表达式假设如下: 消息部分中没有html注释 消息部分中没有包

我正在使用以下模式从网站中提取一些内容:

 ([^+]+)
它输出

< img src=""http://www."" border=""0""/>

用双引号。我的查询有什么问题?

只有在修改regexp时,您的问题才有意义

但首先,要注意:

一般来说,使用正则表达式实现的目标是不可行的。他们是做这件事的不合适的工具。使用正则表达式,您不会得到100%正确的解决方案

话虽如此,请尝试将[^+]+替换为[^。请注意,此正则表达式假设如下:

消息部分中没有html注释 消息部分中没有包含html注释开口的字符串 消息部分是有效的html片段 否则它将匹配。 你已经被警告了


顺便说一句,dquote加倍必须是imacro环境的标准逃避机制。

唉@MonsterrodVanhugenstein,而一个非常擅长正则表达式的人确实可以在一天结束时不眨眼就完成这些提取。目前,您当前的正则表达式匹配一个或多个非“+”符号,并且你可以看到,没有“+”符号。你想得到什么?你给出了什么输入,你想要什么输出。mathematic.coffee我道歉我不知道如何使用REGEXP,这个问题比我的OP所说的要复杂,但对于知道如何使用它的人来说非常简单e细节