Terminal Weka&x27;命令行中的StringToOrdVector过滤器?

Terminal Weka&x27;命令行中的StringToOrdVector过滤器?,terminal,weka,Terminal,Weka,是否可以从命令行在Weka中运行过滤器并获得已处理的输出文件?在将数据反馈回Weka进行培训之前,我想分别对数据进行预处理。所以我试着运行这个过滤器,得到一个输出文件,然后做剩下的事情。我使用的是高端GPU虚拟机,只有SSH访问,因此我不能使用Weka GUI,只能使用命令行。请参阅 java weka.filters.unsupervised.attribute.StringToWordVector-O-L-tokenizer“weka.core.tokenizers.WordTokenize

是否可以从命令行在Weka中运行过滤器并获得已处理的输出文件?在将数据反馈回Weka进行培训之前,我想分别对数据进行预处理。所以我试着运行这个过滤器,得到一个输出文件,然后做剩下的事情。我使用的是高端GPU虚拟机,只有SSH访问,因此我不能使用Weka GUI,只能使用命令行。

请参阅

java weka.filters.unsupervised.attribute.StringToWordVector-O-L-tokenizer“weka.core.tokenizers.WordTokenizer-delimiters\”\\r\\n\\t,;:\\\“\\'()?!-?+*&$%\\\/=[]\\\\@\”-W 10000000-b-i input-train.arff-o output-train-vector.arff-r input-test.arff-s output-test-vector.arff

谢谢,这几乎成功了,但我在Ubuntu上遇到了以下错误:“-bash:-“+*:未找到事件”看起来像是字符编码问题。只需包含相关的参数,忽略其余的。看看它是否有效。
java weka.filters.unsupervised.attribute.StringToWordVector -O -L -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \\r\\n\\t.,;:\\\"\\'()?!-¿¡+*&#$%\\\\/=<>[]_`@\"" -W 10000000 -b -i input-train.arff -o output-train-vector.arff -r input-test.arff -s output-test-vector.arff