节点请求，cheerio-如何处理额外的ajax负载_Ajax_Node.js_Web Scraping_Request_Cheerio - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/node.js/34.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
节点请求，cheerio-如何处理额外的ajax负载_Ajax_Node.js_Web Scraping_Request_Cheerio - Fatal编程技术网

节点请求，cheerio-如何处理额外的ajax负载

ajax node.js web-scraping

节点请求，cheerio-如何处理额外的ajax负载,ajax,node.js,web-scraping,request,cheerio,Ajax,Node.js,Web Scraping,Request,Cheerio,我使用节点request和cheerio从html页面获取数据。这并没有什么问题，但是一个页面通过ajax加载额外的数据来填充不同的容器。当初始请求完成时，这些是空的和未定义的，我如何以最佳方式处理它 request(url, function (error, response, html) { if (!error && response.statusCode == 200) { var $ = cheerio.load(html); forum_url =

我使用节点request和cheerio从html页面获取数据。这并没有什么问题，但是一个页面通过ajax加载额外的数据来填充不同的容器。当初始请求完成时，这些是空的和未定义的，我如何以最佳方式处理它

request(url, function (error, response, html) {
if (!error && response.statusCode == 200) {

    var $ = cheerio.load(html);

    forum_url = $('.this.url.is.loaded.separatly.with.ajax'[1].attr('href');
}
});

Cheerio的设计并没有真正考虑ajax。如果能够提取需要下载的URL，则可能需要维护多个独立的
$
对象，因为它们不太可能轻松合并
通常，如果您需要执行在一个刮过的页面上找到的javascript，我们会转向Phantom.js。Phantom是一款无头浏览器，可以使用javascript控制，非常酷

您可以在此处查看一些Phantom.js web抓取代码：
因此，在使用cheerio.load之前，没有其他参数或方法保持并等待页面加载的额外时间？或者如果可以使用DOMNodeInserted事件。否则，是否有其他类似的节点模块？必须有一个解决办法，幻影不是我在这种情况下的选择。对其他人如何解决类似问题感兴趣。通过检查dom并查看是否有其他方法可以迭代数据来解决我的问题。我发现每个ajax调用都使用同一个url和不同的查询id，所以我将id存储在第一个循环中，然后使用异步序列遍历id。您的链接不再工作<代码>http://code4node.com/snippet/web-scraping-with-node-and-phantomjs

[node.js]相关文章推荐

随机文章推荐

Selenium webdriver 使用phantomjs的selenium webdriver（JS实现）是否不支持appcache？ selenium-webdriver phantomjs

Selenium webdriver Salesforce通过Selenium登录 selenium-webdriver automation salesforce

Selenium webdriver 如何在JMeter脚本中加密数据 selenium-webdriver jmeter

Selenium webdriver 无法使用selenium webdriver下载文件 selenium-webdriver

Selenium webdriver 关注web元素 selenium-webdriver

Selenium webdriver CodedUI的Selenium组件不启动chromedriver.exe selenium-webdriver

Selenium webdriver Selenium Web驱动程序能否帮助从数据库中提取数据 selenium-webdriver

Selenium webdriver Browsermob的时间似乎不合适 selenium-webdriver

Selenium webdriver 如何使用Webdriver在BMC项目中执行下拉 selenium-webdriver

Selenium webdriver Selenium/Python：如何使用相对url向所有锚定标记插入绝对url？ selenium-webdriver

Selenium webdriver 如果标签文本为；“发动机容量”；然后只获取位于“0”前面的元素的文本；“发动机容量”； selenium-webdriver

Selenium webdriver Can'；t单击selenium web驱动程序中的第二个按钮 selenium-webdriver

Selenium webdriver 如何防止dataprovider将登录凭据等敏感数据打印到控制台？ selenium-webdriver testng

Selenium webdriver Selenium C#-为什么Chrome的详细日志记录不适用于此代码？ selenium-webdriver

Selenium webdriver 页面工厂出现空指针异常 selenium-webdriver

Selenium webdriver 单击Spectron selenium-webdriver electron

Selenium webdriver 如何使用EventFiringWebDriver获取innerHTML更改事件通知 selenium-webdriver

Selenium webdriver 使用哪个定位器？我正在使用xpath，但它不起作用 selenium-webdriver

Selenium webdriver 传递变量组和采样器 selenium-webdriver jmeter

Selenium webdriver 运行selenium webdriver脚本时发生Jmeter脚本错误 selenium-webdriver jmeter

[ajax]相关推荐

AJAX回发和页面生命周期
Ajax

grailswebflow与Ajax
Ajax Grails

ColdFusion和Ajax:调用CFC时出错
Ajax Coldfusion

如何操作ajax响应文本
Ajax

jQuery将AJAX数据转换为HTML
Ajax Jquery

跨域jQuery.ajax有时不'；不能在firefox 8中使用，但可以在Chrome/IE中使用
Ajax Firefox Jquery

ajax-将下拉选项值作为列表传递
Ajax Jquery Drop Down Menu

Ajax.begin'；部署到Web服务器时无法工作
Ajax Asp.net Mvc

jsf2 f:datatable中的ajax呈现问题
Ajax Jsf 2

Ajax android emulator和restful web服务无法使用PhoneGap
Ajax Cordova Android Emulator

Ajax 查看Magento 1.7过滤器目录产品
Ajax Magento Filter

如何使用fancybox通过ajax动态加载数据
Ajax

如何为模板中的特定使用Django（类）视图（通过Ajax）；我正在我的项目中集成django聊天室应用程序
Ajax Django Class Templates

JSF2.0响应已被注释（ajax）
Ajax Events Jsf

ajax请求后返回div的响应
Ajax Html

对RESTWeb服务的Ajax调用不起作用
Ajax Rest Jquery

在popupPanel中选择extendedDataTable不在Ajax请求参数中
Ajax Jsf

Ajax 为什么XMLHttpRequest规范阻止设置接受编码头？
Ajax

ajax在yii中调用另一个ajax
Ajax Yii

jquerypost的随机ajax错误
Ajax Facebook

Wordpress：使用多个文件引用为AJAX创建nonce
Ajax Wordpress

wordpress插件中的Ajax在apache上工作，但不在nginx上工作
Ajax Wordpress Nginx

Ajax 如何在测试环境中模拟失败的XHR调用
Ajax Google Chrome Devtools

Drupal 7.3 ajax错误-我无法创建视图
Ajax Drupal

Grails remoteFunction ajax帮助
Ajax Grails

Spring4WebFlow-AF2Tiles Ajax：除了
Ajax Spring

Ajax angular 2中http请求中的异步选项
Ajax Http Angular

Ajax 使用代理，在angular 4应用程序中未发送Cookie，使用withCredentials设置为true
Ajax Angular Cookies Proxy Cors

Ajax Jquery数据表数据到mvc控制器
Ajax Model View Controller Asp.net Core Datatables

将数据加载到表单：使用Ajax在Laravel中选择
Ajax Laravel

Tags

Ms Access Sublimetext2 Select Utf 8 Modelica Design Patterns Postman Mapping Facebook Xamarin.ios Autohotkey Url Ruby Itext Dynamic Omnet++ Gwt Keyboard Emacs Rdf Graphics Ignite Google App Maker Pyspark Protractor Gridview Install4j Leaflet System Verilog Scroll Twilio Sql Server 2012 Doxygen Model Sas Fullcalendar Php Tsql Certificate Webpack Pytorch Azure Data Factory Automation Nativescript Wcf Pandas Symfony1 Air Dialogflow Es Spring Log4j Primefaces Node.js Visual Studio Code Symfony Drupal 7 Css Scikit Learn Google Maps Api 3 Soap Grails Asp.net Mvc Serialization Atom Editor Memory Management Mips Reference Odata Sql Server 2005 Eclipse Rcp Kendo Ui Excel Formula Variables Batch File Map Telegram Mpi Audio Struct Openlayers Sql Neural Network List Jquery Ui Mongoose Memory Leaks Networking Sequelize.js Xaml Printing Google Colaboratory Angular6 Nuget Jhipster Project Management Http Keycloak Requirejs Ruby On Rails 4 Search Sql Server 2008 Notifications Model View Controller Spring Integration Speech Recognition Phpstorm Dns Ipad Visual Studio 2017 Nestjs Network Programming Ipython Types Android Studio Microservices Influxdb Azure Cosmosdb Sml Sitecore Ssl Opencart Iis Visual C++ Tree Filesystems Security Ckeditor Teradata Animation Sockets Ffmpeg Nest Groovy Google Cloud Dataflow Ruby On Rails Akka Woocommerce Database Stata Erlang Oracle10g Neo4j Recursion Debugging Android Layout Discord.py Serial Port Discord.js Arrays Google Cloud Storage Gcc Isabelle Asp.net Lisp Anaconda Identityserver4 Loops React Native Centos Dataframe Jupyter Notebook Sass Opengl Domain Driven Design Macos Hazelcast Mariadb Parse Platform Flask Botframework Post Maven Hibernate Maven 2 Google Cloud Firestore Function C++ Amazon Redshift Google Drive Api Wpf Asp.net Web Api Crystal Reports Sbt Sprite Kit Web Swiftui Rally Class Jsp Google Apps Script Tcl Nsis Gruntjs Typo3 Libgdx Visual Studio 2012 Permissions Devexpress Jpa Parameters Encoding

Copyright © 2024. All Rights Reserved by - Fatal编程技术网