Character encoding 使用wget更改文本编码下载文件

Character encoding 使用wget更改文本编码下载文件,character-encoding,wget,Character Encoding,Wget,我要获取的网页具有windows-1251字符集编码。 有没有一种方法不只是简单地下载这个页面,而是自动下载。。嗯。。将其中的文本转换为uft-8 我尝试向wget添加其他参数,如 --header='Accept-Charset: utf-8' 但是没有运气。你可以用 iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html 转换编码。请参见您能给出一个示例页面吗?当然,可能的解决方案。。但是有没有办法只用wget来解决这个问题呢?

我要获取的网页具有windows-1251字符集编码。 有没有一种方法不只是简单地下载这个页面,而是自动下载。。嗯。。将其中的文本转换为uft-8

我尝试向wget添加其他参数,如

--header='Accept-Charset: utf-8'
但是没有运气。

你可以用

iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html

转换编码。请参见

您能给出一个示例页面吗?当然,可能的解决方案。。但是有没有办法只用wget来解决这个问题呢?也许不能直接解决,但是
wget-O./tmp.htm怎么样http://www.popmech.ru/article/12858-kosmicheskiy-grom/ &&iconv-f ISO-8859-1-t UTF-8./tmp.htm>/output.htm
是的,它可以工作(只有它应该是-f=windows-1251),但该方法的问题在于,在运行该命令之前,我们应该知道字符集。