Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/412.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/node.js/40.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 仅从字符串将大型HTML的一部分加载到Cheerio中。-效率问题_Javascript_Node.js_Web Scraping_Cheerio - Fatal编程技术网

Javascript 仅从字符串将大型HTML的一部分加载到Cheerio中。-效率问题

Javascript 仅从字符串将大型HTML的一部分加载到Cheerio中。-效率问题,javascript,node.js,web-scraping,cheerio,Javascript,Node.js,Web Scraping,Cheerio,我有一个很长的HTML,我想用Cheerio.js删除它。 我想以一种更有效的方式来完成它,而不仅仅是加载整个HTML,而我只需要从中删除一个特定的标记 标签是: <a class="uniqueClass" .....> ... here there might be multiple other tags. </a> ... 这里可能有多个其他标记。 请注意,我不需要帮助来选择带有Cheerio的标签并用它来完成我的工作。我只想找到一种更有效地加载它的方

我有一个很长的HTML,我想用Cheerio.js删除它。 我想以一种更有效的方式来完成它,而不仅仅是加载整个HTML,而我只需要从中删除一个特定的标记

标签是:

<a class="uniqueClass" .....>
    ... here there might be multiple other tags.
</a>

... 这里可能有多个其他标记。
请注意,我不需要帮助来选择带有Cheerio的标签并用它来完成我的工作。我只想找到一种更有效地加载它的方法,而不是加载整个大型HTML

  • 效率非常重要

谢谢你的帮助

在得到响应(包含所有源代码)之前,您对请求的资源一无所知,因此无法从的“nothing”中“选择/刮取”一部分/标签/任何内容除非您知道/加载所有内容

这里有一个伪代码解决方案,但我需要实现方面的帮助:1。获取HTML2。找到包含标记3的子字符串,而不是加载整个HTML字符串。将子字符串加载到ChereIO中您可以在ChereIO中加载整个页面,获取所需的部分,创建另一个仅包含所选部分的ChereIO实例,并删除第一个实例。即使您要拆分它,在其中查找某些内容,您也需要先获取整个源代码。然后你可以逐行阅读或者做任何你想做的事情。这正是我所追求的,在我把源代码作为一个字符串抓取之后,我想简化这个字符串,让它只包含我需要的标记。这将节省我将整个长HTML加载到cheerio.js对象的时间