Lucene java中单词词干和柠檬化的最简单方法库
我有一个简单的项目,需要实现这类事情Lucene java中单词词干和柠檬化的最简单方法库,lucene,nlp,lemmatization,porter-stemmer,Lucene,Nlp,Lemmatization,Porter Stemmer,我有一个简单的项目,需要实现这类事情 Sports - > Sport Walking -> Walk and ideally also do things like: good -> better better -> good person -> people people -> person 有人能给我指一指能达到这个目的的最轻松的方式吗?(我知道有像Lucene、CoreNLP等lib),但这些都很重,我真的需要一个词干分析器/柠檬酸盐分析器 谢
Sports - > Sport
Walking -> Walk
and ideally also do things like:
good -> better
better -> good
person -> people
people -> person
有人能给我指一指能达到这个目的的最轻松的方式吗?(我知道有像Lucene、CoreNLP等lib),但这些都很重,我真的需要一个词干分析器/柠檬酸盐分析器
谢谢大家! 如果您对粗略结果(如
更新
->更新
)没有意见,并且权重非常重要,请使用词干分析。看一看致力于阻止和提供几个选项的文章:,和其他。
还有一个是作为
如果你想要更复杂的结果,你必须处理柠檬化,这也是:斯坦福CoreNLP(其实并不复杂)或基于WordNet