Javascript 寻找一个好的ISO语言标签列表(按母语人数)
我正在寻找一个文件与语言代码和名称的语言在相应的语言。如果按照母语人士的数量来排序,那就太好了 我想像下面的列表,但更大和下载Javascript 寻找一个好的ISO语言标签列表(按母语人数),javascript,json,internationalization,iso,Javascript,Json,Internationalization,Iso,我正在寻找一个文件与语言代码和名称的语言在相应的语言。如果按照母语人士的数量来排序,那就太好了 我想像下面的列表,但更大和下载 { "cmn" : ["Chinese", "官话"], "es" :["Spanish", "español"], "en": ["English", "English"], ... "ru": ["Russian", "Русский"] } 我不知道你想要的东西是否现成。您可能需要自己创建它,从最大的语言开始,逐步过渡到较小的语言 这个问题带来了几个困
{ "cmn" : ["Chinese", "官话"],
"es" :["Spanish", "español"],
"en": ["English", "English"],
...
"ru": ["Russian", "Русский"] }
我不知道你想要的东西是否现成。您可能需要自己创建它,从最大的语言开始,逐步过渡到较小的语言 这个问题带来了几个困难:
- 世界上有6000-7000种语言,但并非所有语言都有语言标签
- 发言者人数的估计总是有些过时,但有些估计比其他估计更过时。在咨询维基百科以创建我的语言标签列表时,估计日期为20世纪90年代初至2010年。因此,这些数字并不完全具有可比性
- 对较小语言和没有官方地位的语言的估计往往非常粗略,有时甚至不存在李>
- 一些语言标签,特别是ISO 639-3中的语言标签,是“包容性代码”,即它们标识语言组(例如汉语),而不是单个语言
- 对于某些语言,有时区分不同国家/地区使用的变体很有用,例如,当您想要区分比利时-荷兰语或荷兰语与荷兰的语音合成时
- 到目前为止,最简单的选择似乎是,因为它们是每个人都在引用的参考资料
- Unicode发布公共语言环境数据存储库或CLDR。其补充数据部分包含有关领土和语言的信息,包括人口。看
- SIL维护一份关于特定语言(如南非荷兰语)的ISO 639-3 URL列表,该列表指向有关该语言的资源。特别是,他们指出了MultiTree和Wikipedia页面,这些页面提供了关于说话人数量的估计(同样,这些数字来自人种志/SIL)。所以你可以写一个刮板来取你需要的东西
另一个选择可能是回答一个稍有不同的问题,例如:每种语言的互联网用户数,或信用卡用户数,等等,取决于你的目标。关于列表中的第一项,我不会将(标准)中文翻译为官话 但作为普通话 (或汉语 或中文). 中国人不叫他们的语言官话 但他们知道什么普通话 是的,你最后用了什么?