UTF-8和en_AU.UTF-8之间的差异

UTF-8和en_AU.UTF-8之间的差异,utf-8,Utf 8,我在UTF-8中有一些文本,但在文本编辑器中仍然显示奇怪(文本编辑器有UTF-8编码集)。我知道,例如,ISO8859-2是一个与ascii兼容的单字节编码,具有特定于territority的高128值,因此该territority的ppl仍然可以使用单字节编码来显示不属于ascii的字符,并且不需要像UTF-8那样使用多字节编码。这个en_AU是en_AU.UTF-8的一部分有什么用途?难道这就是为什么即使是UTF-8,我的文本仍然乱七八糟的原因吗?我的意思是,当使用en_AU时,一些值应该映

我在UTF-8中有一些文本,但在文本编辑器中仍然显示奇怪(文本编辑器有UTF-8编码集)。我知道,例如,ISO8859-2是一个与ascii兼容的单字节编码,具有特定于territority的高128值,因此该territority的ppl仍然可以使用单字节编码来显示不属于ascii的字符,并且不需要像UTF-8那样使用多字节编码。这个en_AU是en_AU.UTF-8的一部分有什么用途?难道这就是为什么即使是UTF-8,我的文本仍然乱七八糟的原因吗?我的意思是,当使用en_AU时,一些值应该映射到不同的字符?据我所知,UTF-8是不可能的,但这是最后一件事,它可能是文本混乱的原因

从linux上的locale命令输出

LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=

在UNIX系统中,区域设置是磁盘上的文件,它们以特定的编码进行编码。因此,您可能有不同编码的相同区域设置,例如
en_AU.iso55891
en_AU.UTF-8
。这不是UTF-8的一些变体,而是这个特定语言环境文件的变体。如果您的区域设置使用区域设置的UTF-8变体,那么使用区域设置系统的任何东西都将输出UTF-8编码值。

您在哪里看到“en_AU.UTF-8”?@IMSoP:这只是一个示例,我将在基本osRelated post上添加我的区域设置的输出。例如,
en_US.utf8
zh_CN.utf8
?我认为UTF-8编码对所有语言都是一样的。是的,同样,这是两种不同地区的UTF-8变体。相同的UTF-8,不同的地区。