Python 字符编码
我的文本编辑器允许我以几种不同的字符格式编码Ansi、UTF-8、UTF-8(无BOM)、UTF-16LE和UTF-16BE 他们之间有什么区别Python 字符编码,python,utf-8,ansi,utf-16,Python,Utf 8,Ansi,Utf 16,我的文本编辑器允许我以几种不同的字符格式编码Ansi、UTF-8、UTF-8(无BOM)、UTF-16LE和UTF-16BE 他们之间有什么区别 通常认为最好的格式是什么(如果有区别的话,我使用的是Python) 。请注意,“ANSI”通常是CP1252。您可能会在没有BOM表的情况下获得最大的实用程序。忘记ANSI和ASCII的存在吧,它们是不推荐使用的恐龙。 “Ansi”是一个用词不当的词,通常指的是当前平台上默认的8位编码(在“西方”Windows安装上通常是这样)。它只支持一小部分字符(
通常认为最好的格式是什么(如果有区别的话,我使用的是Python) 。请注意,“ANSI”通常是CP1252。您可能会在没有BOM表的情况下获得最大的实用程序。忘记ANSI和ASCII的存在吧,它们是不推荐使用的恐龙。
- “Ansi”是一个用词不当的词,通常指的是当前平台上默认的8位编码(在“西方”Windows安装上通常是这样)。它只支持一小部分字符(最多256个不同的字符)
- 是一种可变长度的ASCII兼容编码,能够存储任何和所有Unicode字符。对于支持所有Unicode字符的西方文本来说,这是一个非常好的选择,在一般情况下也是一个非常可行的选择
- “UTF-8(无BOM)”是Windows给出的使用UTF-8而不写入BOM的名称。由于UTF-8不需要BOM,因此不应使用BOM,这将是正确的选择(几乎所有人都将此版本称为“UTF-8”!)
- UTF-16LE和UTF-16BE是编码的版本。与UTF-8一样,UTF-16能够表示任何Unicode字符,但它与ASCII不兼容