Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/visual-studio-2008/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 寻找一个好的ISO语言标签列表(按母语人数)_Javascript_Json_Internationalization_Iso - Fatal编程技术网

Javascript 寻找一个好的ISO语言标签列表(按母语人数)

Javascript 寻找一个好的ISO语言标签列表(按母语人数),javascript,json,internationalization,iso,Javascript,Json,Internationalization,Iso,我正在寻找一个文件与语言代码和名称的语言在相应的语言。如果按照母语人士的数量来排序,那就太好了 我想像下面的列表,但更大和下载 { "cmn" : ["Chinese", "官话"], "es" :["Spanish", "español"], "en": ["English", "English"], ... "ru": ["Russian", "Русский"] } 我不知道你想要的东西是否现成。您可能需要自己创建它,从最大的语言开始,逐步过渡到较小的语言 这个问题带来了几个困

我正在寻找一个文件与语言代码和名称的语言在相应的语言。如果按照母语人士的数量来排序,那就太好了

我想像下面的列表,但更大和下载

{ "cmn" :  ["Chinese", "官话"],
 "es" :["Spanish", "español"],
 "en": ["English", "English"],
 ... 
"ru": ["Russian", "Русский"] }

我不知道你想要的东西是否现成。您可能需要自己创建它,从最大的语言开始,逐步过渡到较小的语言

这个问题带来了几个困难:

  • 世界上有6000-7000种语言,但并非所有语言都有语言标签
  • 发言者人数的估计总是有些过时,但有些估计比其他估计更过时。在咨询维基百科以创建我的语言标签列表时,估计日期为20世纪90年代初至2010年。因此,这些数字并不完全具有可比性
  • 对较小语言和没有官方地位的语言的估计往往非常粗略,有时甚至不存在
  • 一些语言标签,特别是ISO 639-3中的语言标签,是“包容性代码”,即它们标识语言组(例如汉语),而不是单个语言
  • 对于某些语言,有时区分不同国家/地区使用的变体很有用,例如,当您想要区分比利时-荷兰语或荷兰语与荷兰的语音合成时
您最初需要的只是语言标记列表(两个字母代码),因为它们都在那里表示。对于较小的,您最终需要(三个字母的代码)。建议您使用适用于特定语言的最短代码。(因此,在您的示例中,中文的“cmn”将替换为“zh”、“zh-CN”、“zh-TW”或其他内容,具体取决于您希望的具体程度。)

无论如何,我现在在我的一个GitHub存储库中有一个包含400多种语言的JSON文件。看

PS: 有关按字母顺序排列的ISO 639-1标记的JSON列表,请参阅。这些标记不按相应语言中母语人士的数量排序。(ISO 639-3涵盖的许多语言不在ISO 639-1中。)

我将讨论“母语人士的数量”部分:

  • 到目前为止,最简单的选择似乎是,因为它们是每个人都在引用的参考资料
  • Unicode发布公共语言环境数据存储库或CLDR。其补充数据部分包含有关领土和语言的信息,包括人口。看
另一种选择是刮取数据:

  • SIL维护一份关于特定语言(如南非荷兰语)的ISO 639-3 URL列表,该列表指向有关该语言的资源。特别是,他们指出了MultiTree和Wikipedia页面,这些页面提供了关于说话人数量的估计(同样,这些数字来自人种志/SIL)。所以你可以写一个刮板来取你需要的东西
(任何与语言相关的适当资源都将提供一个ISO 639语言代码,用于查找。)


另一个选择可能是回答一个稍有不同的问题,例如:每种语言的互联网用户数,或信用卡用户数,等等,取决于你的目标。

关于列表中的第一项,我不会将(标准)中文翻译为官话 但作为普通话 (或汉语 或中文). 中国人不叫他们的语言官话 但他们知道什么普通话 是的,你最后用了什么?