Xpath 如何使用CasperJS和PhantomJS从表中刮取数据
我正试图搜集一些个人使用的数据。以下是我的CasperJS代码:Xpath 如何使用CasperJS和PhantomJS从表中刮取数据,xpath,web-scraping,phantomjs,casperjs,Xpath,Web Scraping,Phantomjs,Casperjs,我正试图搜集一些个人使用的数据。以下是我的CasperJS代码: var casper = require('casper').create({ verbose: true, logLevel: 'debug', //debug, info, warning, error pageSettings: { loadImages: false, loadPlugins: false, userAgent: 'Mozill
var casper = require('casper').create({
verbose: true,
logLevel: 'debug', //debug, info, warning, error
pageSettings: {
loadImages: false,
loadPlugins: false,
userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4'
},
clientScripts: ["vendor/jquery-3.1.0.js", "vendor/lodash.js"]
});
var fs = require('fs');
var url = 'http://24score.com/football/england/premier_league/2015-2016/regular_season/averages/';
var content = [];
function getContent() {
var content = $(x('//*[@id="total2.5"]/table/tbody[1]/tr[1]/td[1]'));
return _.map(content, function(e) {
return e.innerHTML;
})
}
casper.start(url, function() {
});
casper.then(function() {
content = this.evaluate(getContent);
});
casper.run(function() {
this.echo(content).exit();
});
似乎,我在HTML元素标识方面有问题,我在这里使用XPath,但没有任何效果。但当我选择其他元素时,它会给我一些输出。修复:
__utils__.getElementsByXPath('//*[@id="total2.5"]/table/tbody[1]/tr[1]/td[1]')