基于Lucene的词性标注

基于Lucene的词性标注,lucene,text-mining,sentiment-analysis,Lucene,Text Mining,Sentiment Analysis,我正在为聊天应用程序构建一个情感识别系统。因为核心部分是在用户输入的文本中查找动词,这可以通过词性标记来完成。 可以用Lucene制作一个词性标记器吗?如果没有,我可以使用什么样的开源/libre软件包或系统?来自Lucene,您可能想使用Mahout。我使用了Lucene的Mahout的Bayes分类器进行情绪分析,它工作得相当好,并且相对容易设置。我认为Mahout+Lucene与其他任何东西相比的主要好处是它的扩展性更好 如果你不喜欢Mahout,有很多开源框架可以做这件事。例如,我发现N

我正在为聊天应用程序构建一个情感识别系统。因为核心部分是在用户输入的文本中查找动词,这可以通过词性标记来完成。
可以用Lucene制作一个词性标记器吗?如果没有,我可以使用什么样的开源/libre软件包或系统?

来自Lucene,您可能想使用Mahout。我使用了Lucene的Mahout的Bayes分类器进行情绪分析,它工作得相当好,并且相对容易设置。我认为Mahout+Lucene与其他任何东西相比的主要好处是它的扩展性更好


如果你不喜欢Mahout,有很多开源框架可以做这件事。例如,我发现NLTK非常用户友好,尽管我认为它与Lucene的集成不是很好

查找动词被称为词性标记(POS),而不是语义角色标记(SRL)。SRL是关于检测语义谓词(不需要是动词)的参数类型的。我不清楚你到底希望POS-tagger或SRL系统做什么才能使其对情绪识别有用。最后,你说的“用Lucene建立这样一个系统”是什么意思?使用Lucene来构建它?将结果输入Lucene?编辑以回应您的评论,@jogojapan。