Internationalization 更改文件编码

Internationalization 更改文件编码,internationalization,character-encoding,Internationalization,Character Encoding,我在一些HTML页面中使用了字符编码。问题的原因似乎是一些.html文件没有保存为UTF-8编码文件。尽管我已经指示Eclipse将这些文件保存为UTF-8,但当我在浏览器中打开它们时,它表明这些文件是ISO-8859-1 如何将这些文件的编码更改为UTF-8 更新:我已经在每个网页的部分中包含了以下内容 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 我正在使用ApacheWeb服务器

我在一些HTML页面中使用了字符编码。问题的原因似乎是一些.html文件没有保存为UTF-8编码文件。尽管我已经指示Eclipse将这些文件保存为UTF-8,但当我在浏览器中打开它们时,它表明这些文件是ISO-8859-1

如何将这些文件的编码更改为UTF-8

更新:我已经在每个网页的部分中包含了以下内容

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

我正在使用ApacheWeb服务器

谢谢,
Donal

UTF-8的问题在于,这些文件的开头没有神奇的字节序列-浏览器检测UTF-8的唯一机会是通过XML声明、HTML元标记或一些试探法作为回退

确保HTML的头中有XML编码声明或一些HTML元标记

<?xml version="1.0" encoding="utf-8"?>

如果是XHTML,则位于DOCTYPE下方,或者

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

在标题部分。

您可以使用将文件从一种字符编码转换为另一种字符编码。

尝试添加

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">


添加到html文件的头部分,或确保服务器使用内容类型http头为文件提供服务。如果没有这两个选项,浏览器只能猜测字符编码。

您可能需要更改web服务器发送给客户端的内容类型标题

编辑:虽然这在这种特殊情况下确实有效,但在其他情况下,使用其他海报建议的工具更改文件编码可能是更好的解决方案。YMMV


关于在Eclipse中另存为UTF-8的说明(我知道您已经有了):

您可能应该更改工作区中HTML文档的默认编码

这是针对Eclipse3.4的。如果您有不同的版本,则可能略有不同

转到窗口->首选项
在首选项窗口中转到常规->内容类型
此时,您可以在“首选项”窗口底部附近为文件指定“默认编码”。展开“文本”并选择HTML。在“默认编码”条目中,输入UTF-8。然后单击右侧的“更新”


在此之后,所有HTML文件都应该以UTF-8格式保存。

据我所知,在Eclipse中设置字符编码实际上并不会转换文件——它只是告诉Eclipse您希望如何解释它们。您最好使用Adam建议的转换器工具。

在Eclipse 3.7中,转到:

Windows>首选项>常规>工作区


在“文本文件编码”下设置所需的文件编码。

您使用的是哪台web服务器?