Html web文档编码与文档中显式使用的编码之间的混淆
我知道这是一个非常愚蠢的问题,但不幸的是,我自己无法解决。当涉及到编码和字符集主题时,我总是感到困惑。我将解释我从主题中理解的内容,然后问我的问题Html web文档编码与文档中显式使用的编码之间的混淆,html,encoding,character-encoding,meta,Html,Encoding,Character Encoding,Meta,我知道这是一个非常愚蠢的问题,但不幸的是,我自己无法解决。当涉及到编码和字符集主题时,我总是感到困惑。我将解释我从主题中理解的内容,然后问我的问题 当您想要保存一个文件时,您可以使用特定的字符编码,这意味着文件的每个字符都可以根据其编码放入内存中。对吧? 例如,如果html文件具有utf-16编码,这是否意味着浏览器使用utf-16编码对给定文件进行解码以读取源代码 在meta元素中使用charset属性是否定义了语言(html)应该使用什么编码来在浏览器中正确显示字符 而且html本身添加了一
当您想要保存一个文件时,您可以使用特定的字符编码,这意味着文件的每个字符都可以根据其编码放入内存中。对吧? 例如,如果
html
文件具有utf-16
编码,这是否意味着浏览器使用utf-16
编码对给定文件进行解码以读取源代码
在meta
元素中使用charset
属性是否定义了语言(html
)应该使用什么编码来在浏览器中正确显示字符
而且html
本身添加了一个“html字符引用”,它与unicode字符代码无关
Edit1:
所以在@snakecharmerb之后,我意识到了我的一些错误:
1-我不知道[text]文件编码没有元数据
2.charset
属性告诉浏览器文件的编码,因为这些信息不能从文件本身构思出来(在某种程度上它可以。请参阅答案)
3-文本文件只能有一种编码,如果文件使用utf-8编码,则表示它遵循Unicode字符集(UCS)。不能对另一个字符集使用utf-8编码,现在utf-8和unicode这两个术语几乎可以互换 当您想要保存一个文件时,您可以使用特定的字符编码,这意味着文件的每个字符都可以根据其编码放入内存中。对吧?
- 是的,每个字符都被编码为一个特定的数值;解码将数值转换回字符
- 浏览器将尝试使用web服务器响应标题中
标题中提供的编码对页面进行解码;如果标题缺失或未指定编码,则将使用页面中的内容类型
标记。如果两者都未指定,浏览器可能会尝试从文档内容推断编码,最后返回拉丁语-1元字符集
- w3c总是设置meta标记,只有在您确信内容类型头是正确的情况下才设置内容类型头,并且总是使用UTF-8作为编码
- 它告诉浏览器应该使用哪种编码来解码页面
- html实体(如
或'
)独立于任何特定编码,但它们的组成字符本身将被编码和解码&39;