Localization 是否有本地化语言环境代码的标准?

Localization 是否有本地化语言环境代码的标准?,localization,Localization,我目前正在从事一个项目,该项目将受益于本地化的地区代码。例如,RFC 5646和母标准BCP 47定义了各种语言环境的语言环境代码,例如英国英语的en GB和使用简体中文的新加坡汉语的zh Hans SG。不幸的是,这些代码只使用拉丁字母表的一小部分 我正在寻找一个类似的标准或常用系统,在每种语言的各自书写系统中定义一组语言代码(有点类似于自动拼音) 编辑:我严格地寻找本地化的语言环境代码,因为在问题的上下文(URI i18n/l10n)中,使用autoglossonym或其他详细的等效名称是不

我目前正在从事一个项目,该项目将受益于本地化的地区代码。例如,RFC 5646和母标准BCP 47定义了各种语言环境的语言环境代码,例如英国英语的en GB和使用简体中文的新加坡汉语的zh Hans SG。不幸的是,这些代码只使用拉丁字母表的一小部分

我正在寻找一个类似的标准或常用系统,在每种语言的各自书写系统中定义一组语言代码(有点类似于自动拼音)


编辑:我严格地寻找本地化的语言环境代码,因为在问题的上下文(URI i18n/l10n)中,使用autoglossonym或其他详细的等效名称是不合理的。

RFC 5656和BCP 47指定的语言环境代码是可由机器解析的。因此,en-GB是“英语(大不列颠)”,zh-Hans-SG是“汉语(新加坡,简体中文)”

它们的设计使网页、电子书和其他文档能够以标准方式指定它们所使用的语言和脚本

因此,每个语言、脚本和国家都从各自的标准中获得了一个唯一的代码,并在IANA语言子标签注册表()中进行了整理


对于本地化版本,最好将代码映射到本地化名称(例如,本地化子标记注册表数据库的描述字段,或使用类似iso代码的项目),并以可呈现的方式格式化,保留区域设置代码作为内部表示。

如果它在每种语言的本地书写系统中,它会有什么好处?有些语言有许多本地书写系统(例如:一些突厥语和伊朗语的西里尔语、拉丁语和阿拉伯语字母,蒙古语的几十种)。另外,请注意方言边界几乎从不遵循政治边界。例如,委内瑞拉西部的西班牙语方言更接近哥伦比亚东部的方言,而不是其各自首都的语言,但你只能在本地化中看到“共同西班牙语”和“VE西班牙语”的列表。虽然我同意在这种情况下方言往往被搁置一旁,但广义本地化总比没有本地化好(当然是企业的经济问题)。至于优势,我认为这是一个可读性的问题。日本本土读者会更清楚地理解“日语”还是“日语”日本語". 我认为后者更具娱乐性。我不知道有任何这样的标准,也不知道除了不太流行的语言之外,它是否可行——一个或另一个名字甚至可能产生政治影响:西班牙语应该是“卡斯特拉诺”还是“西班牙人”"?维基百科在其本族语中所称的语言可能是最接近标准的语言……我会非常谨慎地使用本地化的语言环境代码。语言环境代码,就像语言一样,确实应该是机器可读的,以牺牲人类可读性为代价。不遵守标准方案会比单一的唯美主义者产生更多的问题c一它会解决这个“拉丁字母表的小子集”被调用并用于代码是出于一个幸运的原因,几乎所有其他字符集/编码/代码页都包含ASCII作为一个精确子集,因此转换编码永远不会弄乱它们。这有什么不好的呢?请参阅上面我对limetom对我的原始问题的评论的评论。简言之,不能使用autoglossonym在问题上下文中使用,导致需要本地化的区域设置代码。