Api 推特语言代码“;在;

Api 推特语言代码“;在;,api,twitter,iso,iso-639,Api,Twitter,Iso,Iso 639,我从twitter流媒体api获取tweet消息,我发现其中一些消息的参数是语言代码“in”。语言代码应该在ISO639-1标准中,但我还没有找到它对应的语言。有人知道吗?,“in”是印尼语的前ISO 639-1语言代码(“id”是从1989年11月3日开始使用的),但这似乎很奇怪 我所做的是:它用这种奇怪的“in”语言给你发了一堆tweet,你只需点击灰色的“show translation”按钮,Bing就可以帮你完成这项工作。因为我点击的所有推特要么是马来语,要么是印度尼西亚语(似乎是,不

我从twitter流媒体api获取tweet消息,我发现其中一些消息的参数是语言代码“in”。语言代码应该在ISO639-1标准中,但我还没有找到它对应的语言。有人知道吗?

,“in”是印尼语的前ISO 639-1语言代码(“id”是从1989年11月3日开始使用的),但这似乎很奇怪

我所做的是:它用这种奇怪的“in”语言给你发了一堆tweet,你只需点击灰色的“show translation”按钮,Bing就可以帮你完成这项工作。因为我点击的所有推特要么是马来语,要么是印度尼西亚语(似乎是,不管这意味着什么),我想说的是,“in”包含了这两种语言,这两种语言似乎是印度尼西亚所说的两种主要语言


在大多数情况下,如果你不知道一种语言是什么,只需在Google Translate中输入几行代码,让它自动为你检测该语言,这至少会给你一个很大的提示

如Twitter开发者文档中所述,“in”用于印尼语(web archive链接供将来参考):

在他们的文件中,他们说他们使用的是BCP 47标准,该标准在术语上指的是ISO 639,正如其他答案中提到的,其中只有一个古老的版本将印尼语称为“In”。看起来有点像他们开发了什么,然后试图找到一个a类描述他们开发的标准


无论如何,我不知道Twitter上的“in”语言检测的精确度,所以在你把它作为应用程序中的一个重要因素之前,先检查一下它的工作情况。根据我自己的经验,我知道Twitter语言检测不支持的“斯瓦希里”语言的推文通常被指定为塔加洛语(“tl”),这使得“tl”分类非常不可靠……

我认为这不是一个可靠的假设。我正在查看一个Twitter数据集,其中有大量的
记录,我看不到任何马来语/印尼语。。