Regex将获得<;a href>;来自java中的字符串
如果我有Regex将获得<;a href>;来自java中的字符串,java,regex,Java,Regex,如果我有 <img class="size-full wp-image-10225" alt="animals" src="abc.jpg"> blah blah blah <a href="http://en.wikipedia.org/wiki/Elephant">elephant is an animal</a> blah 废话废话 废话 我想要一个正则表达式来给我输出: blah blah blah <a
<img class="size-full wp-image-10225" alt="animals" src="abc.jpg"> blah blah blah
<a href="http://en.wikipedia.org/wiki/Elephant">elephant is an animal</a> blah
废话废话
废话
我想要一个正则表达式来给我输出:
blah blah blah <a href="http://en.wikipedia.org/wiki/Elephant">elephant is an animal</a> blah
废话废话
没有
。我可以分别执行str.replace(“,”)
,但是如何获取从blah blah…
开始的字符串,直到blah
(包括链接标记) 也许是这样的
^<[^>]*>\s*|
^]*>\s*|
Java转义:
^<[^>]*>\\s*|
^]*>\\s*|
^]*>\\s*
将匹配第一个img
标记和以下任何空格。然后更换
。替换字符串为“”
不过,您可能需要使用适当的HTML解析器,因为它不太可能损坏。您必须分别删除
img
标记。你只需要a标签吗?这对RegExpr有效。如果您想在标记前后获取其他文本,这里有问题。为什么不轻易删除不需要的标签?我也需要标签前的文本。所以基本上我不能说StringUtils.removeHTMLTags(),因为这会删除所有标记,我需要html标记。所以基本上我想的是在ahref之前找到第一个“>”,然后从那里捕获文本,直到(包括)在标题中看到regex和HTML。但是我没有得到java转义部分。那么我应该这样做吗:str.replace(^]*>\s*|,“”)@user3298846使用Java中的转义版本: