用于自然语言处理的Python与Java

用于自然语言处理的Python与Java,java,python,text,nlp,similarity,Java,Python,Text,Nlp,Similarity,我一直在用java来寻找两个文档之间的相似之处。我更喜欢寻找语义相似性,但还没有努力去寻找它。我使用以下方法 提取术语/标记(我使用JAWS和wordnet删除同义词,从而提高相似性) 制作一个术语文档矩阵 LSA 余弦相似性 当我查看一些stackoverflow页面时,我得到了很多python实现的链接 我想知道python是否是一种更好的语言来查找文本相似性,还想知道我是否能在python中找到两个文档之间的语义相似性,假设您没有限制您选择语言的平台限制,您应该根据自己最熟悉的语言(我自己

我一直在用java来寻找两个文档之间的相似之处。我更喜欢寻找语义相似性,但还没有努力去寻找它。我使用以下方法

  • 提取术语/标记(我使用JAWS和wordnet删除同义词,从而提高相似性)
  • 制作一个术语文档矩阵
  • LSA
  • 余弦相似性
  • 当我查看一些stackoverflow页面时,我得到了很多python实现的链接


    我想知道python是否是一种更好的语言来查找文本相似性,还想知道我是否能在python中找到两个文档之间的语义相似性,假设您没有限制您选择语言的平台限制,您应该根据自己最熟悉的语言(我自己更喜欢Python)以及应用程序的最佳库来选择语言(正如@GregHewgill所指出的,Python工具()是成熟和全面的)

    所以,虽然我个人会选择Python,但它确实是你必须自己选择的东西

    ==编辑==


    这篇关于Java NLP库的文章可能会帮助您决定是否可以使用Java进行分析;最上面的答案有一个列表,您可以进行调查。如果没有关于您的问题集的更多信息,我无法提供更具体的建议。

    您可以在Python中完成的所有操作,也可以在Java中完成(只要做足够的工作)。也就是说,有一个Python库,它为自然语言处理提供了很多工具。谢谢。。我以前从未使用过python。但是如果它有这么多的功能,我想我应该转向python并利用它。所以我想知道它是否会有优势,或者它们是否只提供了类似的功能。我发现Python作为一种语言更自然、更具表现力。但实际上,这是关于图书馆的。如果我有问题要解决,最好的库是基于Java的,我会使用基于JVM的语言。谢谢链接。我的项目旨在根据文档与参考文档的相似性对文档进行排序。我的目标是从本地存储库中查找最相关的文档。由于它具有实时使用的前景,我希望它尽可能有效。如果您对库感兴趣,这里有一个链接,指向另一篇Stackoverflow文章,概述了查找Python或基于Java的代码的几个地方: