Java Stanford标记器从命令行管道输出运行到文件

Java Stanford标记器从命令行管道输出运行到文件,java,command-line,nlp,Java,Command Line,Nlp,我到处寻找,以确定是否可以从命令行运行Stanford CoreNLP tokenizer组件,并将输出直接传输到文件(就像使用Stanford中文分词器所做的那样),但我还没有看到任何明确的答案,所以我在这里提出一个明确的问题,这可能吗?如果是,怎么做 我已尝试使用在上指定的命令,即 最后添加了对>output.txt的修改,我意识到这是非常简单的,但正如我前面提到的,对于有效的分段器来说 这将告诉我有多少令牌,作为终端的输出,但是output.txt文件总是空的,为什么?也许我可以采用一些替

我到处寻找,以确定是否可以从命令行运行Stanford CoreNLP tokenizer组件,并将输出直接传输到文件(就像使用Stanford中文分词器所做的那样),但我还没有看到任何明确的答案,所以我在这里提出一个明确的问题,这可能吗?如果是,怎么做

我已尝试使用在上指定的命令,即

最后添加了对
>output.txt
的修改,我意识到这是非常简单的,但正如我前面提到的,对于有效的分段器来说

这将告诉我有多少令牌,作为终端的输出,但是output.txt文件总是空的,为什么?也许我可以采用一些替代管道策略

理想情况下,我想要的是在一个输出文件中将所有标记分隔到不同的行上

在这一点上,我想我将不得不编写一个小型Java程序来实现这个任务,是这样吗

更新:

就在那里。回答我自己的问题。似乎是这样。只需将解析器添加到类路径,然后就可以在命令行中使用这些命令。但由于某些原因,将CoreNLP添加到类路径并不起作用

我想我需要做的是在我可以从命令行使用它之前将标记器放到java类路径上,这就是上面代码中-cp所指的。不过,由于某种原因,我没能坚持下去。听起来对吗

java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse,dcoref -file input.txt