Javascript 如何使用phantomJS在动态网页上抓取特定数据?
我知道我在问一个非常笼统的问题,但我对javascript和phantomJS真的很陌生。我正在尝试构建一个网络爬虫来抓取网页上的特定信息 现在我的代码是这样的,它提供了页面上的所有内容Javascript 如何使用phantomJS在动态网页上抓取特定数据?,javascript,web-scraping,phantomjs,web-crawler,Javascript,Web Scraping,Phantomjs,Web Crawler,我知道我在问一个非常笼统的问题,但我对javascript和phantomJS真的很陌生。我正在尝试构建一个网络爬虫来抓取网页上的特定信息 现在我的代码是这样的,它提供了页面上的所有内容 var page = require('webpage').create(); page.open ('https://www.lennar.com/new-homes/washington/seattle', function(status) { console.log("status:
var page = require('webpage').create();
page.open ('https://www.lennar.com/new-homes/washington/seattle', function(status) {
console.log("status: " + status);
if (status === "success"){
// page.render('example.png');
console.log(page.plainText);
}
phantom.exit();
});
现在它给了我一切,但我想在这一页上的粗体字
如果你点击打开链接
我想抓取黑体字和位置
所以基本上我想打印:
广州高地
广州公园南
坎顿岭
克丽丝蒂交叉路口
鹰谷
我真的不懂。有什么建议会有帮助吗?我应该从哪里开始看呢?你读过关于网页抓取的教程吗?现在您可以打开目标页面了,您认为下一步应该做什么?一种方法是使用jQuery,在chrome中打开该页面并将其粘贴到控制台:
jQuery('h1 a')。text()
您读过关于网页抓取的教程吗?现在可以打开目标页面了,您认为下一步应该做什么?一种方法是使用jQuery,在chrome中打开该页面并将其粘贴到控制台:jQuery('h1 a')。text()