Java 如何更改Weka中的最大属性?
我正在使用Weka创建一个术语文档矩阵,使用类StringToWordVector。然而,无论输入语料库的大小如何,我在输出中只能看到500个术语/“num属性”,而当我使用Rtm包时,相同的语料库生成549个术语 我尝试更改wordsToKeep设置,但这不会影响生成的术语总数。对我来说,似乎有一些默认设置,我需要更改以增加生成的术语。但是,我没有找到这样的配置 我正在使用Weka 3.6.11和NGramTokenizerJava 如何更改Weka中的最大属性?,java,nlp,weka,Java,Nlp,Weka,我正在使用Weka创建一个术语文档矩阵,使用类StringToWordVector。然而,无论输入语料库的大小如何,我在输出中只能看到500个术语/“num属性”,而当我使用Rtm包时,相同的语料库生成549个术语 我尝试更改wordsToKeep设置,但这不会影响生成的术语总数。对我来说,似乎有一些默认设置,我需要更改以增加生成的术语。但是,我没有找到这样的配置 我正在使用Weka 3.6.11和NGramTokenizer 如何使Weka生成更多的术语?我升级到Weka 3.7.11并尝试了
如何使Weka生成更多的术语?我升级到Weka 3.7.11并尝试了此功能,效果良好
StringToWordVector filter = new StringToWordVector();
filter.setWordsToKeep(Integer.MAX_VALUE);