Java 从段落中提取关键字

Java 从段落中提取关键字,java,stemming,text-classification,Java,Stemming,Text Classification,我想从我的文本中提取关键字。我的文章必须与音乐、体育、农业等相关,所以我想从一个段落中提取关键词。我想用Java做这件事,我搜索了很多,但找不到任何好的算法或程序来做这件事 搜索之后,我发现python中有关键字提取算法。但是我需要用Java来做这件事。 我现在做的是 1)Divided a paragraph into sentences. 2)Removed stop-words 3)calculated word frequency of each sentence. 但问题是,我们不能

我想从我的文本中提取关键字。我的文章必须与音乐、体育、农业等相关,所以我想从一个段落中提取关键词。我想用Java做这件事,我搜索了很多,但找不到任何好的算法或程序来做这件事

搜索之后,我发现python中有关键字提取算法。但是我需要用Java来做这件事。 我现在做的是

1)Divided a paragraph into sentences.
2)Removed stop-words
3)calculated word frequency of each sentence.

但问题是,我们不能说词频最大的句子是主句。我也计划做一个总结器,从一个段落中提取主要句子。现在我完全被这个问题困扰了。任何人都可以帮助我。如果有任何帮助,我们将不胜感激。

您可能想看看如何定义关键字?提取主要主题词。我不能定义它,因为它取决于每个段落/文本。如果你想用算法搜索它,你必须有一个定义。顺便说一句,有很多文本处理库,我相信你会找到一个适合你需要的现有算法。