Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/377.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 按公共属性将ARFF文件合并在一起_Java_Merge_Weka_Data Processing_Arff - Fatal编程技术网

Java 按公共属性将ARFF文件合并在一起

Java 按公共属性将ARFF文件合并在一起,java,merge,weka,data-processing,arff,Java,Merge,Weka,Data Processing,Arff,我目前有两个单独的ARFF文件,用于我正在编写的一个Java程序,该程序使用WEKAs机器学习算法。这两个文件的格式如下: @attribute movieID numeric @attribute title {whole, host, of, movie, titles} @attribute genres {whole, list, of, genres} 及 在理想的情况下,我希望通过电影ID“连接”这两个文件,以便将相关标签分配给电影,但我不确定这是否可行?在进行了一次相当老的搜索之

我目前有两个单独的ARFF文件,用于我正在编写的一个Java程序,该程序使用WEKAs机器学习算法。这两个文件的格式如下:

@attribute movieID numeric
@attribute title {whole, host, of, movie, titles}
@attribute genres {whole, list, of, genres}

在理想的情况下,我希望通过电影ID“连接”这两个文件,以便将相关标签分配给电影,但我不确定这是否可行?在进行了一次相当老的搜索之后,我不确定到底该如何进行,或者总体上不确定如何创建一个数据集,以便与程序的其余部分一起使用研究关联规则。任何帮助都将不胜感激

R中的外部软件包能够读取和写入ARFF文件

  • 您可以先在R中的两个不同数据帧中读取这两个文件(请参见 )

  • 然后使用“merge”命令以您需要的任何方式连接数据帧(请参见 )

  • 最后,您可以轻松地在新的ARFF文件中写入新的数据帧(请参见 )


这不是一个非常复杂的解决方案,但我会在Weka中将两个ARFF文件转换为.csv。然后使用Excel或类似的工具,我会打开每个文件并对电影ID进行排序,然后简单地通过复制不同的列来组合这两个文件。之后,我将使用Weka读取csv并将其重新保存为.arff。
@attribute movieID numeric
@attribute tags {very, long, list, of, possible, tags}
@attribute timestamp numeric