Javascript 使用CasperJS抓取内容

Javascript 使用CasperJS抓取内容,javascript,web-scraping,casperjs,Javascript,Web Scraping,Casperjs,我正试图用CasperJS库在这个页面上抓取电影链接。我正在半封闭地学习教程 当我以我想要的.sourceNameCell类的锚定子标记为目标时,只会找到JSON对象,尽管我认为我是通过使用.sourceNameCell>a作为选择器来提取锚定值的 我非常感谢您能给一位初露头角的Javascript开发者提供任何反馈 请在下面找到我的代码 var casper = require('casper').create(); var links = []; function getLinks() {

我正试图用CasperJS库在这个页面上抓取电影链接。我正在半封闭地学习教程

当我以我想要的.sourceNameCell类的锚定子标记为目标时,只会找到JSON对象,尽管我认为我是通过使用.sourceNameCell>a作为选择器来提取锚定值的

我非常感谢您能给一位初露头角的Javascript开发者提供任何反馈

请在下面找到我的代码

var casper = require('casper').create();
var links = [];

function getLinks() {
    var links = document.querySelectorAll('.sourceNameCell > a');
    return Array.prototype.map.call(links, function(e) {
        return e;
    });
}
casper.start('http://www.solarmovie.so/watch-pompeii-2014.html', function() {
   this.evaluate(getLinks);
});


casper.then(function() {
    // aggregate results for the 'phantomjs' search
    links = links.concat(this.evaluate(getLinks));
});

casper.run(function() {
    // echo results in some pretty fashion
    this.echo(links.length + ' links found:');
    this.echo(' - ' + links.join('\n - ')).exit();
});

我是Javascript新手,但教程显示returne.getAttribute'href'。Chris在尽可能使用xpath的问题上是正确的,css在这里可以正常工作

为了澄清我的答案:

替换:返回e;第7行,如果计数正确


使用:返回e.getAttribute'href'

越早使用xpath与casper的fetchtext by xpath结合使用越好。Xpath是获取页面上所需数据的最可靠的方法。请在回答中添加一些示例代码。这对于一个好的答案来说是不够的。