Javascript 使用刮刀刮削时出现错误的字符集
我目前正在使用Scraperjs抓取一个带有字符集ISO-8859-1的网站。我的问题是像æ、ø、å和é这样的字符没有正确编码(它们显示/保存为问号) 有什么想法吗 刮片:Javascript 使用刮刀刮削时出现错误的字符集,javascript,node.js,character-encoding,web-scraping,Javascript,Node.js,Character Encoding,Web Scraping,我目前正在使用Scraperjs抓取一个带有字符集ISO-8859-1的网站。我的问题是像æ、ø、å和é这样的字符没有正确编码(它们显示/保存为问号) 有什么想法吗 刮片: 我自己找到了解决办法。您需要将编码指定为二进制,以便读取显示的字符。见下面的代码: scraperjs.StaticScraper.create() .request({ url:"http://vg.no", encoding: "binary"}) .scrape(func
我自己找到了解决办法。您需要将编码指定为二进制,以便读取显示的字符。见下面的代码:
scraperjs.StaticScraper.create()
.request({ url:"http://vg.no", encoding: "binary"})
.scrape(function($) {
return $("p").map(function() {
return $(this);
});
})
.then(function(domElements).........
我自己找到了解决办法。您需要将编码指定为二进制,以便读取显示的字符。见下面的代码:
scraperjs.StaticScraper.create()
.request({ url:"http://vg.no", encoding: "binary"})
.scrape(function($) {
return $("p").map(function() {
return $(this);
});
})
.then(function(domElements).........