Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/393.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java Weka StringToWordVector过滤器中可以使用哪些类型的文本文件_Java_Filter_Weka - Fatal编程技术网

Java Weka StringToWordVector过滤器中可以使用哪些类型的文本文件

Java Weka StringToWordVector过滤器中可以使用哪些类型的文本文件,java,filter,weka,Java,Filter,Weka,我知道文本文件应该转换为arff文件,但我不知道文本文件中有什么内容?它完全是一个字符串,比如“我是java”,还是像这样 @relation @attribute numerical @attribute numerical @data 文本内容“我是java”您可以轻松地从包含实例(以RAW为单位)和特征(或属性)值(以列为单位)的电子表格转换为ARFF。ARFF文件的大部分由实例列表组成,每个实例的属性值用逗号分隔。大多数电子表格和数据库程序允许您以逗号分隔值(CSV)格式将数

我知道文本文件应该转换为arff文件,但我不知道文本文件中有什么内容?它完全是一个字符串,比如“我是java”,还是像这样

@relation 

@attribute  numerical
@attribute  numerical

@data

文本内容“我是java”

您可以轻松地从包含实例(以RAW为单位)和特征(或属性)值(以列为单位)的电子表格转换为ARFF。ARFF文件的大部分由实例列表组成,每个实例的属性值用逗号分隔。大多数电子表格和数据库程序允许您以逗号分隔值(CSV)格式将数据导出到文件中,作为项目之间带有逗号的记录列表。完成此操作后,只需将文件加载到文本编辑器或文字处理器中;使用@relation标记添加数据集的名称,使用@attribute添加属性信息,并添加@data行;然后将文件另存为原始文本。或者在WEKA explorer中上载您的csv文件(预处理(以csv形式打开文件)然后将其另存为arff。

谢谢,我已经用weka函数得到了解决方案。但我关心的另一个问题是,如果我有培训数据集并且经过培训,我用stringtowordvector函数得到了arff文件。如果我想在测试文件中使用相同的功能,我该怎么办?您可以将
stringtowordvector
两者都应用到tra通过在命令行中使用批处理选项(
-b
)对数据集进行初始化和测试。请参阅:。您可以在以下位置检查如何以三种不同方式匹配培训和测试词汇表:。