Html 元字符集windows-1252与UTF-8

Html 元字符集windows-1252与UTF-8,html,character-encoding,fonts,meta-tags,Html,Character Encoding,Fonts,Meta Tags,我的HTML页面使用 是否建议更改为UTF-8,为什么 我用UTF-8检查了我的一些页面,得到了一些带有数学符号的问号。例如:x应改为x以正确显示。我尝试了CpConverter,但没有很好地转换所有符号 有没有更好的方法来转换许多文件 UTF-8是普遍认可的标准,适用于任何地方。Windows任何编码都是Windows特定的,不保证在任何机器上工作。另外,看一看 如果要更改文件的编码,可以通过多种方式进行。您可以在文本编辑器/IDE中查找编码类型,或使用以下命令(未测试,但应该可以正常工作):

我的HTML页面使用

  • 是否建议更改为
    UTF-8
    ,为什么
  • 我用
    UTF-8
    检查了我的一些页面,得到了一些带有数学符号的问号。例如:x应改为x以正确显示。我尝试了
    CpConverter
    ,但没有很好地转换所有符号 有没有更好的方法来转换许多文件

  • UTF-8是普遍认可的标准,适用于任何地方。Windows任何编码都是Windows特定的,不保证在任何机器上工作。另外,看一看
  • 如果要更改文件的编码,可以通过多种方式进行。您可以在文本编辑器/IDE中查找编码类型,或使用以下命令(未测试,但应该可以正常工作):

  • iconv-f WINDOWS-1252-t UTF-8 filename.txt

    这是一个老问题,但我的回答可能会帮助其他人做出更好的决定

    从ANSI(windows-1252)更改为UTF-8大约会使HTML文件的大小增加一倍。(取决于文件中使用的字符)

    如果要测试此功能,只需在记事本中创建一个包含以下字符的文件:

    الف

    这些字符采用ANSI(Windows-1256)和Unicode。使用ANSI(Windows-1256)编码和UTF-8编码保存文件一次

    UTF-8文件的大小:9字节

    ANSI(Windows-1256)文件的大小:3字节


    如果要更改页面的字符集,只需在记事本或任何其他编辑器中打开它们,并使用UTF-8编码另存为即可。

    第一个问题的答案是肯定的。建议您完全更改所有HTML5文档的所有字符编码属性

    这是因为根据W3C,它是当前的HTML5标准。由于所有标记呈现的标准化是不可避免的,因此我将仅基于这个原因更改任何给定站点中的所有页面

    这可以在任何具有查找/替换功能的编辑器上轻松完成。只需使用该功能在每个文档中查找术语

    并将其替换为

    UTF-8字符编码应该能够处理您的数学字符,但如果它不能保持原始字符集不变的话。而剩下的只包含文本的页面,您将希望更改为UTF-8。下面是您的字符编码的位置

    HTML5规范鼓励web开发人员使用UTF-8 字符集,几乎涵盖所有字符和符号 在这个世界上! --

    如果大小是一个问题,你只会留下那些文件,有特殊的数学字符的原始编码要求,如果他们没有正确地呈现,我不认为这会影响你的浏览器加载时间足以损害你的搜索引擎优化。 如果你有很多带有数学符号的页面,那么如果你在寻找一个受欢迎的网站或商业网站,这可能是一个问题,如果不是大小太小,那么文件大小的问题似乎就没有了

    对于其他文档,即使有BOM,也应将其编码更改为UTF-8

    如果文件开头有UTF-8字节顺序标记(BOM) 然后是Internet Explorer 10或11以外的最新浏览器版本 将使用它来确定页面的编码为UTF-8。信息技术 具有比任何其他声明(包括HTTP)更高的优先级 标题

    如果有BOM表,可以跳过元编码声明,但是 建议您保留它,因为它有助于人们查看 确定页面编码的源代码。 --


    祝你好运,编码快乐!:-)

    恐怕是的。您可以始终使用记事本-文件->另存为->编码->UTF-8抱歉,还有一个Windows翻译-看一看。UTF-8将正确显示我的名字,所以我说,去吧:)并且您正确地避免了较长的“text/html”变体()如果您使用标准字母数字字符,使用UTF-8不会增加html文件的大小。您编写的那些字符不能用ASCII表示。当您将其保存为ASCII时,它只是将其转换为“?”。当您将UTF-8文件保存在记事本中时,这9个字节中有3个是BOM:字节序列0xEF、0xBB、0xBF。(仅6个字节用于表示您键入的字符。)这些字符将以ASCII格式保存。它们是标准的波斯/阿拉伯字符。但是将它们与UTF-8文件一起使用会使大小加倍。字符
    الف
    在ASCII中不存在。不可能用ASCII码对它们进行编码。只需试一下我在投票前说的话。正如@Isaac所说,这些字符不是ASCII码,但你似乎把ASCII码和Windows-1256混为一谈,Windows-1256允许使用阿拉伯语字符。