Filter 如何应用stringtoword向量过滤器

Filter 如何应用stringtoword向量过滤器,filter,weka,options,Filter,Weka,Options,我试图使用weka gui对一些文本数据进行分类 我正在使用stringtoword过滤器,属性索引默认值设置为first-last 然而,我试着把它改成像去年的1500 它给了我一个无效范围列表的错误 最初,我的arff只有两个属性 class text 我有什么做错了吗 我很确定文本文件中有很多单词,当我运行first-last的默认过滤器时,它会给我10000个属性属性索引采用索引,分别是您希望转换为单词向量的属性的索引。所以有两个属性,一个是类,一个是索引1,另一个是文本,索引2。 设

我试图使用weka gui对一些文本数据进行分类

我正在使用stringtoword过滤器,属性索引默认值设置为first-last

然而,我试着把它改成像去年的1500

它给了我一个无效范围列表的错误

最初,我的arff只有两个属性

class
text
我有什么做错了吗


我很确定文本文件中有很多单词,当我运行first-last的默认过滤器时,它会给我10000个属性

属性索引采用索引,分别是您希望转换为单词向量的属性的索引。所以有两个属性,一个是类,一个是索引1,另一个是文本,索引2。 设置first-last会同时使用这两个属性,而且很可能对类没有任何作用,因为它通常是单值的,并从属性文本生成单词向量

切中要害,在这种情况下,您唯一的选择是使用2或first-last,但结果将是相同的。500超出范围,因为您只有2个属性

注:如果您希望仅使用从获得的单词向量中获得的单词范围,您可以使用移除过滤器并指定要移除的列(单词)的索引