在使用https.request(options,callback)node.js访问模板和503状态代码之前检查浏览器
我想获取此页面的html进行解析(单击链接了解我想要获取的内容) 这是我请求此页面内容的代码在使用https.request(options,callback)node.js访问模板和503状态代码之前检查浏览器,node.js,webrequest,http-status-code-503,Node.js,Webrequest,Http Status Code 503,我想获取此页面的html进行解析(单击链接了解我想要获取的内容) 这是我请求此页面内容的代码 var https = require("https"); var fs = require("fs"); var options = { hostname: "www.prizebond.net", port: 443, path: "/dlist.php?num=455", method: "GET" }; var response = ""
var https = require("https");
var fs = require("fs");
var options = {
hostname: "www.prizebond.net",
port: 443,
path: "/dlist.php?num=455",
method: "GET"
};
var response = "";
var req = https.request(options, function (res) {
res.setEncoding("UTF-8");
console.log(res.statusCode);
res.on("data", function (chunk) {
response += chunk;
});
res.on("end", function () {
fs.writeFile("750-bond.html", response, function (err) {
if (err) {
console.log(err.message);
}
console.log("File downloaded");
});
console.log("end");
});
});
req.end();
现在的问题是,在我的750-bont.html文件中,我得到了奇怪的
“在访问prizebond.net之前检查浏览器的结果”而不是
原创内容。这是我打开750时得到的截图-
浏览器中的bond.html文件
我做错了什么?我怎样才能得到这个网页的原始内容呢?你不能,除非你写一些更复杂的东西,但你可能不应该 Cloudflare保护的目的是防止您试图实现的不幸
您可以研究通过公共API或prizebond.net提供的东西访问任何您想访问的内容的可能性。您不能,除非您编写了更复杂的内容,但您可能不应该这样做 Cloudflare保护的目的是防止您试图实现的不幸
您可以研究通过公共API或prizebond.net提供的东西访问任何您想访问的内容的可能性。您做错了什么?你正在尝试爬网一个不想被爬网的网站。为什么要向下投票?我想我应该等5秒钟,然后继续请求?你做错了什么?你正在尝试爬网一个不想被爬网的网站。为什么要向下投票?我想我应该等5秒钟,然后继续请求?