Javascript承诺链从网站检索价值
为了从“incoming.shopify.com”中提取“当前订单率”,我编写了以下Javascript代码。然而,当我提取源HTML时,源HTML太长,以至于它没有在网站上包含“顺序/分钟”的数字。我想从源HTML中提取“订单/分钟”数字,并使用console.log打印出来Javascript承诺链从网站检索价值,javascript,web-scraping,Javascript,Web Scraping,为了从“incoming.shopify.com”中提取“当前订单率”,我编写了以下Javascript代码。然而,当我提取源HTML时,源HTML太长,以至于它没有在网站上包含“顺序/分钟”的数字。我想从源HTML中提取“订单/分钟”数字,并使用console.log打印出来 var wd = require('wd'); var fs = require('fs'); // defaults var browser_name = 'firefox'; wd.configureHttp({
var wd = require('wd');
var fs = require('fs');
// defaults
var browser_name = 'firefox';
wd.configureHttp({
timeout: 60000,
retries: 3,
retryDelay: 100
});
var browser = wd.promiseChainRemote();
var p = { promise: null };
/*** Expose Components to other files ***/
exports.browser = browser;
exports.p = p;
// setup
p.promise = browser
.init({ browserName: browser_name })
.setAsyncScriptTimeout(30000)
p.promise = p.promise
.get("incoming.shopify.com")
.sleep(1500)
.source(function(err, source_html){
var FindNumberArr = source_html.split('<div class="counter__count" id="volume_rate">');
var Result1 = FindNumberArr.slice(1);
var FindNumberArr2 = Result1.split("</div>");
var Result2 = FindNumberArr2.slice(0);
console.print(Result2);
})
p.promise = p.promise
.quit()
.done();
var wd=require('wd');
var fs=需要('fs');
//默认值
var浏览器名称='firefox';
wd.configureHttp({
超时:60000,
重试次数:3次,
重试延迟:100
});
var browser=wd.promiseChainRemote();
var p={promise:null};
/***向其他文件公开组件***/
exports.browser=浏览器;
出口。p=p;
//设置
p、 promise=浏览器
.init({browserName:browser_name})
.setAsyncScriptTimeout(30000)
p、 允诺
.get(“incoming.shopify.com”)
.睡眠(1500)
.source(函数(err,source\u html){
var findnumberar=source_html.split(“”);
var Result1=FindNumberArr.slice(1);
var FindNumberArr2=Result1.split(“”);
var Result2=FindNumberArr2.slice(0);
控制台。打印(结果2);
})
p、 允诺
.退出
.完成();
初始HTML的计数器为“---”。它必须设置在JS中的某个位置,无论哪种方式,您都无法通过“获取”来获取初始编号。谢谢@MatTaylor。你知道我应该走哪条路才能通过编程得到这个数字吗?我试着看看它是如何决定这个数字的。不过,我看不到有任何XHR请求被触发,因此在某些JS中可能会被深入引用。