Html 如何为网页正确使用cjk字符?

Html 如何为网页正确使用cjk字符?,html,utf-8,wget,cjk,Html,Utf 8,Wget,Cjk,我无法正确看到cjk字符。这似乎与ISO-8859编码中的错误相同。我认为UTF-8编码是合适的。有人知道如何解决这个问题吗 $ wget http://yjs.cd120.com/daoshi.html $ grep 'selectid="99"' daoshi.html Binary file daoshi.html matches $ file daoshi.html daoshi.html: HTML document text, ISO-8859 text, with very

我无法正确看到cjk字符。这似乎与ISO-8859编码中的错误相同。我认为UTF-8编码是合适的。有人知道如何解决这个问题吗

$ wget http://yjs.cd120.com/daoshi.html 
$ grep 'selectid="99"' daoshi.html 
Binary file daoshi.html matches
$ file daoshi.html 
daoshi.html: HTML document text, ISO-8859 text, with very long lines, with CRLF line terminators

摘要:

步骤1:将数据保存为UTF-8

步骤2:在页面中声明编码

<meta charset="utf-8"/>

步骤3:确保您的服务器执行正确的操作

摘要:

步骤1:将数据保存为UTF-8

步骤2:在页面中声明编码

<meta charset="utf-8"/>


步骤3:确保您的服务器执行正确的操作首先,您必须确定通过
wget
(或
curl
)获得的文件的实际编码是什么

发出命令:

grep 'Content-Type' daoshi.html
将显示:

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
最后,根据您的需要,您可能需要调整文件开头的
meta
标记内容以匹配新编码,例如使用
sed

sed s/charset=gb2312/charset=utf-8/ daoshi-utf8.html >daoshi-utf8-final.html

首先,您必须确定通过
wget
(或
curl
)获得的文件的实际编码是什么

发出命令:

grep 'Content-Type' daoshi.html
将显示:

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
最后,根据您的需要,您可能需要调整文件开头的
meta
标记内容以匹配新编码,例如使用
sed

sed s/charset=gb2312/charset=utf-8/ daoshi-utf8.html >daoshi-utf8-final.html

我犯了这个错误。你知道怎么了吗?谢谢<代码>$wget-qO-http://yjs.cd120.com/daoshi-2.html|iconv-f gb2312-t utf-8>/dev/null iconv:(标准输入):430:173:无法转换http://yjs.cd120.com/daoshi.html|iconv-f gb2312-t utf-8>/dev/null工作正常,所以问题出在文件
daoshi-2.html
:它在430:173位置包含一个字符,
iconv
无法转换。。。您可以尝试下载文件而不转换它,然后对该行进行一些十六进制转储以发现“罪魁祸首”。。。您还可以将
-c
选项添加到
iconv
命令中,以自动丢弃无法转换的字符,而不是导致转换错误:
wget-qO-http://yjs.cd120.com/daoshi-2.html|iconv-c-f gb2312-t utf-8>/dev/null
我收到了这个错误。你知道怎么了吗?谢谢<代码>$wget-qO-http://yjs.cd120.com/daoshi-2.html|iconv-f gb2312-t utf-8>/dev/null iconv:(标准输入):430:173:无法转换http://yjs.cd120.com/daoshi.html|iconv-f gb2312-t utf-8>/dev/null工作正常,所以问题出在文件
daoshi-2.html
:它在430:173位置包含一个字符,
iconv
无法转换。。。您可以尝试下载文件而不转换它,然后对该行进行一些十六进制转储以发现“罪魁祸首”。。。您还可以将
-c
选项添加到
iconv
命令中,以自动丢弃无法转换的字符,而不是导致转换错误:
wget-qO-http://yjs.cd120.com/daoshi-2.html|iconv-c-f gb2312-t utf-8>/dev/null