Java语言识别

Java语言识别,java,open-source,nlp,Java,Open Source,Nlp,是否有针对Java的开源语言识别?仅适用于c/c++ UPD: 我说的是人类文字语言。例如: 输入:我的名字是约翰。 输出:英语 输入:我是约翰。 输出:德语 输入:Мззжж。 输出:俄语。查看您对中版本的看法。这假设您想找出文本所使用的语言,而不是为编程语言构建解析器。我认为这是相当标准的。Textcat没有俄语,但它可以处理以下内容: 阿尔巴尼亚语 丹麦人 荷兰语 英式 芬兰语 法语的 德文 匈牙利语 意大利人 挪威人 擦亮 斯洛伐克人 斯洛文尼亚语 西班牙文 瑞典人 有一个通过HTTP

是否有针对Java的开源语言识别?仅适用于c/c++

UPD:

我说的是人类文字语言。例如:

输入:我的名字是约翰。 输出:英语

输入:我是约翰。 输出:德语

输入:Мззжж。
输出:俄语。

查看您对中版本的看法。这假设您想找出文本所使用的语言,而不是为编程语言构建解析器。

我认为这是相当标准的。

Textcat没有俄语,但它可以处理以下内容:
  • 阿尔巴尼亚语
  • 丹麦人
  • 荷兰语
  • 英式
  • 芬兰语
  • 法语的
  • 德文
  • 匈牙利语
  • 意大利人
  • 挪威人
  • 擦亮
  • 斯洛伐克人
  • 斯洛文尼亚语
  • 西班牙文
  • 瑞典人

有一个通过HTTP POST接受文本并返回带有检测到的语言和分数的JSON。它可以从Java或任何其他编程语言中使用。

我们中的一个人感到困惑。我以为他想知道文本是中文还是日文,而你们认为他想做一个解析器!我们拭目以待。@B argulies-这无法从问题中推断出来,因此两个答案都有意义。请提供指向TikaPlease的链接,告诉我们您想要哪种软件。它是否应该是一个正式的自动机,识别字符串是否使用特定的正式语言?它是否应该告诉我们文本使用的是什么人类语言?告诉你一些源代码是用什么语言写的?告诉我们一些可执行文件可能是用什么语言编写的?识别声音是单词还是仅仅是噪音?知道人们用什么语言说话吗?有点挑剔,但不得不-1,因为没有任何研究成果显示。。。这是一个好问题,所以我喜欢它。