如何删除HTML“&书信电报;a href=”;使用perl的标签

如何删除HTML“&书信电报;a href=”;使用perl的标签,html,regex,perl,httprequest,Html,Regex,Perl,Httprequest,如何删除HTML文件的链接 我想删除以下链接: <ul class="dropdown-menu"> <li><a href="index_fixed.html">Home / Fixed</a></li> <li><a href="index_with_blog.html">Home + Blog</a></li> <li><a h

如何删除HTML文件的链接

我想删除以下链接:

<ul class="dropdown-menu">

      <li><a href="index_fixed.html">Home / Fixed</a></li>
      <li><a href="index_with_blog.html">Home + Blog</a></li>
      <li><a href="portfolio.html">Portfolio</a></li>
      <li><a href="blog.html">Blog & News</a></li>
    </ul>
  </li>

  <li><a href="left_sidebar.html">left sidebar</a></li>
  <li><a href="right_sidebar.html">right sidebar</a></li>
  <li><a href="full_width.html">full page</a></li>
  <li><a href="contact.html">contact us</a></li>

</ul>
印刷术
  • 短代码
  • 桌子
  • 常见问题解答

    我不想删除以下链接:

    <ul class="dropdown-menu">
    
          <li><a href="index_fixed.html">Home / Fixed</a></li>
          <li><a href="index_with_blog.html">Home + Blog</a></li>
          <li><a href="portfolio.html">Portfolio</a></li>
          <li><a href="blog.html">Blog & News</a></li>
        </ul>
      </li>
    
      <li><a href="left_sidebar.html">left sidebar</a></li>
      <li><a href="right_sidebar.html">right sidebar</a></li>
      <li><a href="full_width.html">full page</a></li>
      <li><a href="contact.html">contact us</a></li>
    
    </ul>
    
  • 这是我的代码,但不起作用:

    #!/usr/bin/perl
    ########################################## Carrega Modulos
    
    use LWP::UserAgent;
    use LWP::Simple;
    
     $ua = new LWP::UserAgent;
     $ua->agent('Mozilla/5.0 (X11; U; NetBSD i386; en-US; rv:1.8.1.12) Gecko/20080301 Firefox/2.0.0.12');
    
     my $pedido1 = new HTTP::Request GET =>"http://localhost/site1/index.html";
     my $resposta1 = $ua->request($pedido1) or die "Error\n"; 
     my $res1 = $resposta1->content;
     open (OUT, ">>hit.txt"); print OUT "$res1\n"; close(OUT); $cont=$cont+1;
    
     $res1 =~ s/"<li><a href=\"typography.html\">Typography<\/a><\/li>"/""/g;
     $res1 =~ s/"<li><a href=\"shortcodes.html\">Shortcodes<\/a><\/li>"/""/g;
     $res1 =~ s/"<li><a href=\"blog.html\">Blog & News<\/a><\/li>"/""/g;
     $res1 =~ s/"<li><a href=\"tables.html\">Tables<\/a><\/li>"/""/g;
     $res1 =~ s/"<li><a href=\"faq.html\">FAQ<\/a><\/li>"/""/g;
     print $res1;
    
    #/usr/bin/perl
    ##########################################卡雷加模
    使用LWP::UserAgent;
    使用LWP::Simple;
    $ua=新LWP::UserAgent;
    $ua->agent('Mozilla/5.0(X11;U;NetBSD i386;en-US;rv:1.8.1.12)Gecko/20080301 Firefox/2.0.0.12');
    my$pedido1=新HTTP::请求GET=>”http://localhost/site1/index.html";
    我的$resposta1=$ua->request($pedido1)或die“Error\n”;
    my$res1=$resposta1->content;
    打开(OUT,“>>hit.txt”);打印出“$res1\n”;收尾$cont=$cont+1;
    $res1=~s/“
  • 切换导航 ultricies Vivamus volatipat egestas.Donec turpis non-eros euismod 阿弥陀佛坐在阿弥陀佛的座位上,封建主义者的名言,奥古斯都的名言,整个世界

    多奈克·帕特·马蒂斯·奥迪奥。奎斯克·厄洛斯。纳拉姆·马莱苏阿达。 洛雷姆·伊普苏姆·多洛·希特·阿梅特,一位杰出的献身者。多内克·奥迪奥。奎斯克·帕特·马蒂斯·厄洛斯

    他是一位伟大的领袖,他是一位杰出的领袖。

    Suspendisse urna nibh、viverra non、semper suscipit、posuere a、pede

    我们的服务 清洁平面&最小 洛雷姆·伊普苏姆·多洛·希特·阿梅特,一位杰出的献身者。多内克·奥迪奥。奎斯克·帕特·马蒂斯·厄洛斯

    完全响应 洛雷姆·伊普苏姆·多洛·希特·阿梅特,一位杰出的献身者。多内克·奥迪奥。奎斯克·帕特·马蒂斯·厄洛斯

    易于定制 洛雷姆·伊普苏姆·多洛·希特·阿梅特,一位杰出的献身者。多内克·奥迪奥。奎斯克·帕特·马蒂斯·厄洛斯

    关于我们 Donec odio.Quisque Pat mattis eros。 马莱苏阿达·埃拉特。 这是一个很好的例子

    奥雷姆·伊普苏姆·多洛尔·西特(Lorem ipsum dolor sit amet)是一位杰出的献身者。多内克·奥迪奥(Donec odio)、奎斯克·沃里克·帕特·马蒂斯·厄洛斯(Quisque Volatis mattis eros)、图皮斯(Nullam malesuada Erta ut turpis)、乌尔纳·尼布(Suspendisse urna nibh)、维韦拉·农(Vi

    这是一个很好的例子。 马蒂斯阿利夸。 这是一个很好的例子

    奥雷姆·伊普苏姆·多洛尔·西特(Lorem ipsum dolor sit amet)是一位杰出的献身者。多内克·奥迪奥(Donec odio)、奎斯克·沃里克·帕特·马蒂斯·厄洛斯(Quisque Volatis mattis eros)、图皮斯(Nullam malesuada Erta ut turpis)、乌尔纳·尼布(Suspendisse urna nibh)、维韦拉·农(Vi

    佩伦特刮水机扫描电镜。乌兰科佩伦特刮水机扫描电镜。乌兰科佩伦特刮水机扫描电镜。乌兰科佩伦特刮水机扫描电镜。。。

    在所有错误情况下,我们都能清楚地看到,所有人都会受到赞扬,对他人的尊重,对发明人和准建筑师来说,生命的意义必须明确。 尼莫·埃尼姆·伊普萨姆·沃鲁帕特(Nemo enim ipsam Voluptate)说,他是一个真正的沃鲁帕特人,他是一个理性主义者 这是一个很好的例子

    关于 我们努力提供超出客户期望的服务水平。

    如果您对我们的产品或服务有任何疑问,请随时与我们联系。我们每周七天都有友好、知识渊博的代表为您提供帮助

    推特 推特
    Etiam egestas,ipsum posuere accumsan sollicitudin,nulla mauris,sit amet rutrum risus

    推特
    这是我生命中最重要的一部分。莫里斯和拉科斯·布兰迪特,马莱苏亚达

    邮件列表 订阅我们的邮件列表,获取优惠、新闻更新等信息


    您的电子邮件: 订阅 生意 街道
    城市、州
    国家

    电话:(111)123-4567
    传真:(111)123-4567

    $('.carousel').carousel({interval:3500,//以毫秒为单位暂停:'无'//设置为'true'以暂停鼠标悬停时的滑块})

    非常感谢

    使用解析器处理HTML中的更改。如果HTML不是很难看,您可以解析它:

    #!/usr/bin/perl
    use warnings;
    use strict;
    
    use XML::LibXML;
    
    my $html = ...; # load the HTML file
    my $dom = 'XML::LibXML'->load_html(string => $html, recover => 1);
    
    my @delete = qw( Typography Shortcodes Tables FAQ );
    my $condition = join ' or ', map "text()='$_'", @delete;
    
    for my $anchor ($dom->findnodes("//a[$condition]/..")) {
        $anchor->parentNode->removeChild($anchor);
    }
    print $dom;
    

    它不仅删除了锚,而且它们的父级
    不会发布您的全部代码。只发布相关部分。到目前为止,您的问题是一堵巨大的文本墙,大多数人都会跳过您的问题。请看。谢谢chris85。我想我已经把所有信息放在一起了,所以毫无疑问。在正则表达式中,不要使用引号输入中的引号也更少。将
    s/“…”/“/
    更改为
    s/../
    。您可能还需要添加
    m
    修饰符以匹配多行(即,将
    s/..//g
    更改为
    s/..//mg
    。也就是说,对于任何更复杂的内容,您可能都应该使用HTML解析器。在XML/HTML上使用正则表达式是非常糟糕的。这是一个很好的解决方案。不过,我想知道OP是否了解如何构建
    $condit>