Javascript 如何使用Puppeter访问excel文件中的链接
我正在尝试使用Puppeter访问excel表中提到的每个链接,但是我无法实现所需的功能 用于遍历excel工作表的每条记录并在url列中显示值的代码Javascript 如何使用Puppeter访问excel文件中的链接,javascript,puppeteer,js-xlsx,Javascript,Puppeteer,Js Xlsx,我正在尝试使用Puppeter访问excel表中提到的每个链接,但是我无法实现所需的功能 用于遍历excel工作表的每条记录并在url列中显示值的代码 var xlsx= require("xlsx"); var wb =xlsx.readFile("Test.xlsx"); var ws= wb.Sheets["Sheet1"]; var data = xlsx.utils.sheet_to_json(ws); var
var xlsx= require("xlsx");
var wb =xlsx.readFile("Test.xlsx");
var ws= wb.Sheets["Sheet1"];
var data = xlsx.utils.sheet_to_json(ws);
var newData= data.map(function(record)
{
console.log(record.url);
});
输出:
D:\Document\study\jswebscrapping\testing> node .\excelpuppeteer.js
https://www.google.com
https://www.yahoo.com
我正在尝试修改上面的代码,以便可以使用Puppeter逐个访问这些URL
var wb =xlsx.readFile("Test.xlsx");
var ws= wb.Sheets["Sheet1"];
var data = xlsx.utils.sheet_to_json(ws);
var newData= data.map(async function(record)
{
const browser = await puppeteer.launch({headless : false});
const page = await browser.newPage();
await page.goto( record.url);
await page.waitFor(4000) ;
await browser.close();
});
上面的代码以一种非常奇怪的方式工作(例如,它访问URL但不要等待4秒钟,或者有时只访问一个URL)。请建议。使用<代码>来。。。对进行迭代,就可以了