Java Stanford标记器从命令行管道输出运行到文件_Java_Command Line_Nlp

Java Stanford标记器从命令行管道输出运行到文件

java command-line nlp

Java Stanford标记器从命令行管道输出运行到文件,java,command-line,nlp,Java,Command Line,Nlp,我到处寻找，以确定是否可以从命令行运行Stanford CoreNLP tokenizer组件，并将输出直接传输到文件（就像使用Stanford中文分词器所做的那样），但我还没有看到任何明确的答案，所以我在这里提出一个明确的问题，这可能吗？如果是，怎么做我已尝试使用在上指定的命令，即最后添加了对>output.txt的修改，我意识到这是非常简单的，但正如我前面提到的，对于有效的分段器来说这将告诉我有多少令牌，作为终端的输出，但是output.txt文件总是空的，为什么？也许我可以采用一些替

我到处寻找，以确定是否可以从命令行运行Stanford CoreNLP tokenizer组件，并将输出直接传输到文件（就像使用Stanford中文分词器所做的那样），但我还没有看到任何明确的答案，所以我在这里提出一个明确的问题，这可能吗？如果是，怎么做

我已尝试使用在上指定的命令，即

最后添加了对

>output.txt

的修改，我意识到这是非常简单的，但正如我前面提到的，对于有效的分段器来说

这将告诉我有多少令牌，作为终端的输出，但是output.txt文件总是空的，为什么？也许我可以采用一些替代管道策略

理想情况下，我想要的是在一个输出文件中将所有标记分隔到不同的行上

在这一点上，我想我将不得不编写一个小型Java程序来实现这个任务，是这样吗

更新：

就在那里。回答我自己的问题。似乎是这样。只需将解析器添加到类路径，然后就可以在命令行中使用这些命令。但由于某些原因，将CoreNLP添加到类路径并不起作用

我想我需要做的是在我可以从命令行使用它之前将标记器放到java类路径上，这就是上面代码中-cp所指的。不过，由于某种原因，我没能坚持下去。听起来对吗

java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse,dcoref -file input.txt