Character encoding 有人能解释一下ja_JP.UTF8吗?
我知道utf8,但是*.utf8之间有什么区别Character encoding 有人能解释一下ja_JP.UTF8吗?,character-encoding,Character Encoding,我知道utf8,但是*.utf8之间有什么区别 从哪个上下文中?ja_JP告诉我们字符串是日语的。这与字符编码没有任何关系,但根据上下文,可能用于排序、键盘输入和程序中显示文本的语言。我猜,每个具有该命名约定的utf8文件都包含用于翻译站点的语言定义。在Unicode之前,处理非英语字符是使用一些技巧完成的,比如代码页(like)和特殊字符集(比如:)。UTF-8包含更大范围的字符,具有完全不同的映射系统(即每个字符的数字寻址方式) Locale = ja_JP Encoding = UTF-
从哪个上下文中?ja_JP告诉我们字符串是日语的。这与字符编码没有任何关系,但根据上下文,可能用于排序、键盘输入和程序中显示文本的语言。我猜,每个具有该命名约定的utf8文件都包含用于翻译站点的语言定义。在Unicode之前,处理非英语字符是使用一些技巧完成的,比如代码页(like)和特殊字符集(比如:)。UTF-8包含更大范围的字符,具有完全不同的映射系统(即每个字符的数字寻址方式)
Locale = ja_JP
Encoding = UTF-8
将ja_JP.UTF8
设置为区域设置时,“UTF8”部分表示所需特殊字符的编码。例如,在日语区域设置中输出货币金额时,需要¥字符。编码信息定义用于显示¥的字符集
我假设可能存在一个ja\u JP.Shift\u JIS
locale。与UTF8 One的一个不同之处在于¥符号的显示方式符合这种特定的编码方式
为什么是ja_JP?
这两个代码表示语言(我认为基于)和国家(基于)。如果一种语言在多个国家使用,这一点很重要。例如,在德语区,瑞士格式的数字与德语不同:1'000'000
vs.1.000.000
。国家代码用于在同一种语言中定义这些区别。它是一个名称。基本格式为语言\u
国家/地区ja
=日语,JP
=日本
除了日期格式、货币符号等,每个区域设置都与字符编码相关联。这是从每种语言都有自己编码的时代遗留下来的历史遗产。现在,UTF-8为每个语言环境提供了一种通用编码
之所以
.UTF8
是语言环境名称的一部分,是为了将其与使用不同编码的旧语言环境区分开来。例如,在我的系统上有一个可用的ja_JP.EUC-JP
locale。对于德国,可以选择de_de
(使用ISO-8859-1编码的过时的欧盟前地区),de_DE@euro
(ISO-8859-15编码,提供欧元符号)和*.utf8和什么之间的de_de.UTF-8
?在哪里查找不同国家/地区?unicode.org的cldr repo,