Unicode 表示用于文本文件的编码

Unicode 表示用于文本文件的编码,unicode,encoding,character-encoding,Unicode,Encoding,Character Encoding,如何存储简单文本文件的编码 在电子邮件中有一个标题 Content-Type: text/plain; charset="UTF-8" 在html中,我们有一个元标记 <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 这就给我留下了一个问题:文本编辑器如何知道使用了什么编码,因为我们没有像在html文件中那样在文本文件中显式地设置它 如果它是一种标准的复杂格式,如.docx或.pdf编码可能

如何存储简单文本文件的编码

在电子邮件中有一个标题

Content-Type: text/plain; charset="UTF-8"
在html中,我们有一个元标记

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">


这就给我留下了一个问题:文本编辑器如何知道使用了什么编码,因为我们没有像在html文件中那样在文本文件中显式地设置它

如果它是一种标准的复杂格式,如
.docx
.pdf
编码可能会作为某种属性存储在那里

如果它是一个简单的文件,如
.txt
.csv
,则编码不会存储在任何地方。文本编辑器将使用启发式来确定保存文件时使用的编码,但这只是一个猜测

阅读更多:


这很有趣,感谢您的解释和链接。