Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/grails/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何更改Weka中的最大属性?_Java_Nlp_Weka - Fatal编程技术网

Java 如何更改Weka中的最大属性?

Java 如何更改Weka中的最大属性?,java,nlp,weka,Java,Nlp,Weka,我正在使用Weka创建一个术语文档矩阵,使用类StringToWordVector。然而,无论输入语料库的大小如何,我在输出中只能看到500个术语/“num属性”,而当我使用Rtm包时,相同的语料库生成549个术语 我尝试更改wordsToKeep设置,但这不会影响生成的术语总数。对我来说,似乎有一些默认设置,我需要更改以增加生成的术语。但是,我没有找到这样的配置 我正在使用Weka 3.6.11和NGramTokenizer 如何使Weka生成更多的术语?我升级到Weka 3.7.11并尝试了

我正在使用Weka创建一个术语文档矩阵,使用类StringToWordVector。然而,无论输入语料库的大小如何,我在输出中只能看到500个术语/“num属性”,而当我使用Rtm包时,相同的语料库生成549个术语

我尝试更改wordsToKeep设置,但这不会影响生成的术语总数。对我来说,似乎有一些默认设置,我需要更改以增加生成的术语。但是,我没有找到这样的配置

我正在使用Weka 3.6.11和NGramTokenizer


如何使Weka生成更多的术语?

我升级到Weka 3.7.11并尝试了此功能,效果良好

StringToWordVector filter = new StringToWordVector(); 
filter.setWordsToKeep(Integer.MAX_VALUE);