Lucene 关于文本挖掘的建议/帮助

Lucene 关于文本挖掘的建议/帮助,lucene,text-mining,Lucene,Text Mining,我需要使用MapReduce概念对单个文档进行文本挖掘 我的一些朋友建议我使用ApacheLucene 但是在阅读了一些关于ApacheLucene的文档之后,我发现它只有在我们需要索引文档时才有用 有人能给我推荐更好的方法吗 提前感谢Lucene是一个文档索引和检索框架。当然,人们可以使用索引数据,如关键字搜索、文档相似性等 如果您对TM感兴趣,可以看看OpenNLP和LingPipe。他们有100多个用于文本挖掘和自然语言处理的库。ApacheMahout是一个用于Hadoop的数据挖掘库

我需要使用MapReduce概念对单个文档进行文本挖掘

我的一些朋友建议我使用ApacheLucene

但是在阅读了一些关于ApacheLucene的文档之后,我发现它只有在我们需要索引文档时才有用

有人能给我推荐更好的方法吗


提前感谢

Lucene是一个文档索引和检索框架。当然,人们可以使用索引数据,如关键字搜索、文档相似性等


如果您对TM感兴趣,可以看看OpenNLP和LingPipe。他们有100多个用于文本挖掘和自然语言处理的库。

ApacheMahout是一个用于Hadoop的数据挖掘库