Java 移除POS标签机的标签

Java 移除POS标签机的标签,java,stanford-nlp,pos-tagger,Java,Stanford Nlp,Pos Tagger,有可能从句子中去掉标记吗?你可以通过扫描文件,找到标签并删除它们来实现这一点,但是因为有很多标签(有些型号有30+,有些型号有48-50左右,基本上都是这样),有没有一种快速而有效的方法来删除标签? 我确实检查了API,但是没有这样的方法来删除标记。没有专门的内置方法,但是由于输出包括单词及其标记,我不确定您为什么需要再次扫描原始文档。您不能通过删除最后一个标记分隔符(“/”或其他任何字符)直到空格来删除标记吗?或者,它可以更简单地使用 -outputFormat tsv 然后,您将得到两列输

有可能从句子中去掉标记吗?你可以通过扫描文件,找到标签并删除它们来实现这一点,但是因为有很多标签(有些型号有30+,有些型号有48-50左右,基本上都是这样),有没有一种快速而有效的方法来删除标签?
我确实检查了API,但是没有这样的方法来删除标记。

没有专门的内置方法,但是由于输出包括单词及其标记,我不确定您为什么需要再次扫描原始文档。您不能通过删除最后一个标记分隔符(“/”或其他任何字符)直到空格来删除标记吗?或者,它可以更简单地使用

-outputFormat tsv

然后,您将得到两列输出,第一列中有单词,第二列中有标记,完成后您可以保留第一列。

您能用一个示例说明您想要什么吗?如果您只是不需要POS标记,那么就不需要运行POS标记器……假设我使用标记器标记了一个文件,现在我想根据每个单词旁边出现的标记对该文件应用某些条件。在那之后,在修改过的文件中,我显然不希望这些标签出现,它们将毫无用处,并且用户不喜欢它们。所以,我想删除标签。我已经找到了一种解决方法,它不像我刚才解释的那样简单,我必须同时扫描原始文档和标记文档中的每一行才能实现。但我只是好奇有没有更简单的方法来删除标记。:-)