Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/380.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 你如何分辨哪些网站是HTML&;JS以及使用React、Angular等通过JS呈现哪些站点。?_Javascript_Scrapy_Rabbitmq_Scrapy Splash - Fatal编程技术网

Javascript 你如何分辨哪些网站是HTML&;JS以及使用React、Angular等通过JS呈现哪些站点。?

Javascript 你如何分辨哪些网站是HTML&;JS以及使用React、Angular等通过JS呈现哪些站点。?,javascript,scrapy,rabbitmq,scrapy-splash,Javascript,Scrapy,Rabbitmq,Scrapy Splash,在创建我的第一个爬虫程序时,我想检查一个网站是否使用某种框架呈现。我知道我可以使用SplashRequest,以便使用无头浏览器渲染它,但这并不高效。我怎样才能知道哪些站点需要通过Splash发布,哪些站点不需要,而不需要发出无用的Splash请求 谢谢 您可以使用此扩展简单地禁用JS,在您想要刮取的网站上,查看您想要刮取的数据在页面上是否可用,如果不可用,您需要检查网站的AJAX调用,或者使用任何无头浏览器,如Selenium或Splash 我建议不要使用SplashRequest,它的编程非

在创建我的第一个爬虫程序时,我想检查一个网站是否使用某种框架呈现。我知道我可以使用SplashRequest,以便使用无头浏览器渲染它,但这并不高效。我怎样才能知道哪些站点需要通过Splash发布,哪些站点不需要,而不需要发出无用的Splash请求


谢谢

您可以使用此扩展简单地禁用JS,在您想要刮取的网站上,查看您想要刮取的数据在页面上是否可用,如果不可用,您需要检查网站的AJAX调用,或者使用任何无头浏览器,如Selenium或Splash


我建议不要使用SplashRequest,它的编程非常糟糕,对开发人员来说也不太透明,我建议使用Scrapy Selenium

谢谢您的回答。这似乎不是很有效,因为我仍然需要为每个页面创建一些请求,然后才能确定它是否是JS呈现的。使用无头浏览器渲染所有内容比使用您的方法更有效。