Javascript 对韩语进行编码,以便使用got爬行
我正在尝试爬网一个有图书馆的网站 我写了一个简单的代码Javascript 对韩语进行编码,以便使用got爬行,javascript,encoding,web-crawler,domcrawler,Javascript,Encoding,Web Crawler,Domcrawler,我正在尝试爬网一个有图书馆的网站 我写了一个简单的代码 import got from 'got'; async function test(){ const data = await got('https://dhlottery.co.kr/store.do?method=topStore&pageGubun=L645', { encoding: 'utf8'}); console.log(data.body); } test(); 它可以工作,但不能正确显示韩语单词
import got from 'got';
async function test(){
const data = await got('https://dhlottery.co.kr/store.do?method=topStore&pageGubun=L645', { encoding: 'utf8'});
console.log(data.body);
}
test();
它可以工作,但不能正确显示韩语单词
输出的一部分在这里
<div class="foot_txt2">
<p>Copyright (c) 2018 ��������ȸ&���ູ��. All rights reserved</p>
<p>�� Ȩ�������� �Խõ� �̸��� �ּҰ� �ڵ� �����Ǵ� ���� �ź��ϸ�, �̸� ���ݽ� ������Ÿ����� ���� ó������ �����Ͽ� �ֽñ� �ٶ��ϴ�.</p>
<p class="f_blue2">û�ҳ��� ������ �����ϰų� ��÷���� ������ �� �����ϴ�.</p>
</div>
版权所有(c)2018��������ȸ&;���ູ��. 版权所有
�� Ȩ�������� �Խõ� �̸��� �ּҰ� �ڵ� �����Ǵ� ���� �ź��ϸ�, �̸� ���ݽ� ������Ÿ����� ���� ó������ �����Ͽ� �ֽñ� �ٶ��ϴ�.
�ҳ��� ������ �����ϰų� ��÷���� ������ �� �����ϴ�.
所有的单词都是韩语
我只是想知道为什么会发生这种情况,以及如何解决它。我以前没有使用过这个软件包,也没有测试过下面的软件包,但希望这可以解决您的问题 在您的示例中,您定义了
utf8
编码,但是,网站使用EUC-KR
编码
因此,如果您根据请求更新encoding
属性,可能会解决问题
从“got”导入got;
异步函数测试(){
常量url=https://dhlottery.co.kr/store.do?method=topStore&pageGubun=L645';
const data=wait get(url{
编码:“EUC-KR”
});
console.log(data.body);
}
test();
我发现encodedeuc-kr
,但是got
不支持编码类型euc-kr
。