Regex 正在查找要删除href文本的正则表达式

Regex 正在查找要删除href文本的正则表达式,regex,Regex,如果我有一堆这样的URL: <li><a href="http://www.xyz.com/sometext/someothertext/123/sometext/">Xyz 123</a></li> <li><a href="http://www.xyz.com/345/sometext/someothertext/">Xyz 345</a></li> 如果删除HREF中的URL使其成为

如果我有一堆这样的URL:

<li><a href="http://www.xyz.com/sometext/someothertext/123/sometext/">Xyz 123</a></li>  
<li><a href="http://www.xyz.com/345/sometext/someothertext/">Xyz 345</a></li>
  • 如果删除HREF中的URL使其成为:

    <li><a href="">Xyz 123</a></li> 
    <li><a href="">Xyz 345</a></li>
    

  • 以下操作应满足您的要求:

    /href=\"([^\"]*)\"/
    

    基本上匹配
    href=“”

    以下内容可以满足您的需要:

    /href=\"([^\"]*)\"/
    

    基本匹配
    href=“”

    搜索
    搜索
    首先,不要使用正则表达式解析HTML-为什么?看一看或看一看

    使用XML阅读器/XML文档处理引擎处理HTML。然后使用XPath查找与您的条件匹配的节点,并在DOM中更改
    href
    属性


    注意:对于不是格式良好的XML的HTML,需要一个更通用的HTML(SGML)解析器。

    首先,不要使用正则表达式解析HTML-为什么?看一看或看一看

    使用XML阅读器/XML文档处理引擎处理HTML。然后使用XPath查找与您的条件匹配的节点,并在DOM中更改
    href
    属性


    注意:对于不是格式良好的XML的HTML,需要一个更通用的HTML(SGML)解析器。

    我部分同意其他人的观点,但需要一个更完整的版本

    /(<a[^>]+href\s*=\s*\")(.*?)("[^>]*>)/$1$3/gi
    
    /(]+href\s*=\s*\”(*?([^>]*>)/$1$3/gi
    
    我部分同意其他人的观点,但更完整的版本是

    /(<a[^>]+href\s*=\s*\")(.*?)("[^>]*>)/$1$3/gi
    
    /(]+href\s*=\s*\”(*?([^>]*>)/$1$3/gi
    
    您使用的是哪种语言/regex实现?您使用的是哪种语言/regex实现?在处理HTML时,正则表达式通常不是选择的工具,通常为True,但此子集(href属性)是正则的,因此regex适用于这种特殊情况。(+1,但只是想澄清一下)一般来说,在处理HTML True时,正则表达式通常不是首选的工具,但此子集(a href属性)是正则的,因此正则表达式适用于这种特殊情况。(+1,但只是想说清楚)