Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/315.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 用OpenNLP从标记词中提取名词短语_Java_Nlp_Text Processing_Opennlp - Fatal编程技术网

Java 用OpenNLP从标记词中提取名词短语

Java 用OpenNLP从标记词中提取名词短语,java,nlp,text-processing,opennlp,Java,Nlp,Text Processing,Opennlp,我正在使用OpenNLP从文本块中提取名词短语。不幸的是,OpenNLP的文档非常混乱 目前,我有两个数组:一个带有标记化文本,另一个带有标记化文本的POS标记。我将这两个字符串输入chunker函数,但chunker只是将文本中的单词标记为O、B-PP、B-NP、I-NP等 我想做的是有一个字符串数组,它只包含文本中的名词短语,而不是一个字符串数组,它将标记文本标记为不同的短语。OpenNLP中是否已经有某种函数可以返回字符串数组中的名词短语(甚至是数组以外的数据结构) 这看起来像是一篇相关的

我正在使用OpenNLP从文本块中提取名词短语。不幸的是,OpenNLP的文档非常混乱

目前,我有两个数组:一个带有标记化文本,另一个带有标记化文本的POS标记。我将这两个字符串输入chunker函数,但chunker只是将文本中的单词标记为O、B-PP、B-NP、I-NP等

我想做的是有一个字符串数组,它只包含文本中的名词短语,而不是一个字符串数组,它将标记文本标记为不同的短语。OpenNLP中是否已经有某种函数可以返回字符串数组中的名词短语(甚至是数组以外的数据结构)

这看起来像是一篇相关的文章,但我认为我们没有做同样的事情,因为他们使用解析树来完成他们的目标。


任何帮助都将不胜感激。提前谢谢

看到我的答案了吗?应该会有帮助的