Character encoding 有人能解释一下ja_JP.UTF8吗？_Character Encoding

Character encoding 有人能解释一下ja_JP.UTF8吗？

character-encoding

Character encoding 有人能解释一下ja_JP.UTF8吗？,character-encoding,Character Encoding,我知道utf8，但是*.utf8之间有什么区别从哪个上下文中？ja_JP告诉我们字符串是日语的。这与字符编码没有任何关系，但根据上下文，可能用于排序、键盘输入和程序中显示文本的语言。我猜，每个具有该命名约定的utf8文件都包含用于翻译站点的语言定义。在Unicode之前，处理非英语字符是使用一些技巧完成的，比如代码页（like）和特殊字符集（比如：）。UTF-8包含更大范围的字符，具有完全不同的映射系统（即每个字符的数字寻址方式） Locale = ja_JP Encoding = UTF-

我知道utf8，但是*.utf8之间有什么区别

从哪个上下文中？ja_JP告诉我们字符串是日语的。这与字符编码没有任何关系，但根据上下文，可能用于排序、键盘输入和程序中显示文本的语言。

我猜，每个具有该命名约定的utf8文件都包含用于翻译站点的语言定义。

在Unicode之前，处理非英语字符是使用一些技巧完成的，比如代码页（like）和特殊字符集（比如：）。UTF-8包含更大范围的字符，具有完全不同的映射系统（即每个字符的数字寻址方式）

Locale = ja_JP 
Encoding = UTF-8

将

ja_JP.UTF8

设置为区域设置时，“UTF8”部分表示所需特殊字符的编码。例如，在日语区域设置中输出货币金额时，需要¥字符。编码信息定义用于显示¥的字符集

我假设可能存在一个

ja\u JP.Shift\u JIS

locale。与UTF8 One的一个不同之处在于¥符号的显示方式符合这种特定的编码方式

为什么是ja_JP？

这两个代码表示语言（我认为基于）和国家（基于）。如果一种语言在多个国家使用，这一点很重要。例如，在德语区，瑞士格式的数字与德语不同：

1'000'000

vs.

1.000.000

。国家代码用于在同一种语言中定义这些区别。

它是一个名称。基本格式为语言

\u

国家/地区

ja

=日语，

JP

=日本

除了日期格式、货币符号等，每个区域设置都与字符编码相关联。这是从每种语言都有自己编码的时代遗留下来的历史遗产。现在，UTF-8为每个语言环境提供了一种通用编码

之所以

.UTF8

是语言环境名称的一部分，是为了将其与使用不同编码的旧语言环境区分开来。例如，在我的系统上有一个可用的

ja_JP.EUC-JP

locale。对于德国，可以选择

de_de

（使用ISO-8859-1编码的过时的欧盟前地区），

de_DE@euro

（ISO-8859-15编码，提供欧元符号）和*.utf8和什么之间的

de_de.UTF-8

？在哪里查找不同国家/地区？unicode.org的cldr repo，