Java 用OpenNLP从标记词中提取名词短语
我正在使用OpenNLP从文本块中提取名词短语。不幸的是,OpenNLP的文档非常混乱 目前,我有两个数组:一个带有标记化文本,另一个带有标记化文本的POS标记。我将这两个字符串输入chunker函数,但chunker只是将文本中的单词标记为O、B-PP、B-NP、I-NP等 我想做的是有一个字符串数组,它只包含文本中的名词短语,而不是一个字符串数组,它将标记文本标记为不同的短语。OpenNLP中是否已经有某种函数可以返回字符串数组中的名词短语(甚至是数组以外的数据结构) 这看起来像是一篇相关的文章,但我认为我们没有做同样的事情,因为他们使用解析树来完成他们的目标。Java 用OpenNLP从标记词中提取名词短语,java,nlp,text-processing,opennlp,Java,Nlp,Text Processing,Opennlp,我正在使用OpenNLP从文本块中提取名词短语。不幸的是,OpenNLP的文档非常混乱 目前,我有两个数组:一个带有标记化文本,另一个带有标记化文本的POS标记。我将这两个字符串输入chunker函数,但chunker只是将文本中的单词标记为O、B-PP、B-NP、I-NP等 我想做的是有一个字符串数组,它只包含文本中的名词短语,而不是一个字符串数组,它将标记文本标记为不同的短语。OpenNLP中是否已经有某种函数可以返回字符串数组中的名词短语(甚至是数组以外的数据结构) 这看起来像是一篇相关的
任何帮助都将不胜感激。提前谢谢 看到我的答案了吗?应该会有帮助的