Html utf-8/utf-16转换

Html utf-8/utf-16转换,html,encoding,utf-8,dreamweaver,utf-16,Html,Encoding,Utf 8,Dreamweaver,Utf 16,当我在Dreamweaver CS6中设计html页面时,我使用了它的验证工具(它将代码发送到w3c),我没有收到任何错误。但是,当我在UltraEdit 21中验证同一页面(它使用HTML Tidy)时,我得到警告: “指定的输入编码(utf-8)与实际输入编码(utf-16)不匹配” 页面设置为html5(带),utf-8(带),并包含希腊文本 问题是: 该问题是否会影响页面的外观?我的意思是,当我发布它时,中国、德国或火地岛的用户会看到希腊文本吗 如果是,其余的就不那么重要了,但我会问他们

当我在Dreamweaver CS6中设计html页面时,我使用了它的验证工具(它将代码发送到w3c),我没有收到任何错误。但是,当我在UltraEdit 21中验证同一页面(它使用HTML Tidy)时,我得到警告: “指定的输入编码(utf-8)与实际输入编码(utf-16)不匹配”

页面设置为html5(带
),utf-8(带
),并包含希腊文本

问题是:

  • 该问题是否会影响页面的外观?我的意思是,当我发布它时,中国、德国或火地岛的用户会看到希腊文本吗
  • 如果是,其余的就不那么重要了,但我会问他们:

  • 是什么让HTML整洁地将文档定义为utf-16?是否有任何类型的字符、单词或可见字符串可以删除/删除以更正问题

  • 如果我使用
    浏览器会正确解析代码吗(对于全局用户,以希腊文本结尾)


  • 实际文件编码将在文件的Dreamweaver属性中设置

    :

    “标题/编码页属性”选项允许您指定特定于用于编写网页的语言的文档编码类型,以及指定与该编码类型一起使用的Unicode规范化表单

  • 选择修改>页面属性,或单击文本属性检查器中的页面属性按钮

  • 选择标题/编码类别并设置选项

    编码 指定用于文档中字符的编码

    如果选择Unicode(UTF-8)作为文档编码,则不需要实体编码,因为UTF-8可以安全地表示所有字符。如果选择其他文档编码,则可能需要实体编码来表示某些字符。有关字符实体的更多信息,请参阅www.w3.org/TR/REC-html40/sgml/entities.html

    包括Unicode签名(BOM) 在文档中包含字节顺序标记(BOM)。BOM表在将文件标识为Unicode的文本文件的开头是2到4个字节,如果是,则为以下字节的字节顺序。由于UTF-8没有字节顺序,因此添加UTF-8 BOM是可选的。对于UTF-16和UTF-32,它是必需的


  • 选择不带BOM的UTF-8。

    UltraEdit会在打开时自动检测文件的编码,并将其显示在状态栏的底部。有关更多详细信息,请参见UltraEdit高级-配置-文件处理-Unicode/UTF-8检测中的,并按下按钮帮助

    UTF-16显示的是自UE v19.00以来使用标准状态栏以UTF-16 Little-Endian编码的文件,无论是否启用BOM。单击状态栏中的此列表框并选择Unicode-UTF-8将导致文件从UTF-16 LE转换为UTF-8,然后将其与HTML5文件头中的字符集声明相匹配

    当在UE v19.00或任何更高版本中使用基本状态栏,或使用v19.00之前的任何UltraEdit版本时,对于UTF-16 LE编码的文件,字段右侧的状态栏字段(带有行、列和剪贴板编号)以U-开头

    有关状态栏的UltraEdit帮助页面包含有关UltraEdit中标准和基本状态栏中显示的信息的更多信息

    转换为UTF-8可以使用UltraEdit完成,也可以使用子菜单中的命令UNICODE/UTF-8转换为UTF-8(UNICODE编辑)“转换”菜单中的命令File

    高级-配置-文件处理-保存中有两个配置设置,用于定义保存带或不带字节顺序标记(BOM)的UTF-8编码文件:

  • 保存时将UTF-8 BOM头写入所有UTF-8文件
  • 在此程序中创建的新文件上写入UTF-8 BOM(如果未设置上述内容)
  • 由于UTF-8编码的HTML文件应始终不包含BOM表,因此在使用UltraEdit主要用于编辑HTML文件时,最好取消选中两个UTF-8 BOM表设置

    使用UltraEdit转换文件的另一种方法是使用菜单文件中的命令另存为,并使用适当的编码/格式设置UTF-8另存为对话框中,意味着将文件保存为UTF-8编码文件,带有BOM和UTF-8-无BOM无BOM,独立于标准保存的两个配置设置

    要使用UltraEdit将在UltraEdit中打开的单个文件夹、文件夹树等中的所有文件转换为UTF-8,有一个UltraEdit脚本解决方案,请参阅

    不幸的是,UEV21.30.0.1024仍然无法识别HTML5标准中定义的短字符集声明
    。请参阅有关此限制的详细信息以及如何解决此限制。如果在前64 KB内至少找到一个UTF-8编码字符,则此限制无关紧要,因为希腊文本的HTML5文件就是这种情况

    与UltraEdit v21.30.0.1024一起安装的HTML Tidy版本为2009年3月25日。我不确定HTMLTidy是否真的支持HTML5的短字符集声明。但它看起来是这样的,因为否则您将不会看到关于使用HTML验证HTML5文件的警告

    阅读UltraEdit power tip可能会对您有所帮助,因为您似乎不知道编码和字符集的真正含义,以及HTML5中的声明与实际使用的编码匹配对应用程序的重要性

    我现在回答你的问题,在所有这些一般的超编辑的东西之后

    该问题是否会影响页面的外观? 虽然文件包含文件内容使用UTF-8编码的声明,但实际使用UTF-16 Little Endian编码,