Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop 将空格分隔的文件(每行=矢量)转换为SequenceFile_Hadoop_Mahout_Sequencefile - Fatal编程技术网

Hadoop 将空格分隔的文件(每行=矢量)转换为SequenceFile

Hadoop 将空格分隔的文件(每行=矢量)转换为SequenceFile,hadoop,mahout,sequencefile,Hadoop,Mahout,Sequencefile,我创建了大文本文件(4GB),如下所示 0 1 2 3 2 1 3 6 2 0 6 4 3 0 6 3 0 0 1 6 7 3 9 4 每行描述一个向量,每列表示向量的每个元素。每个元素由一个空格分隔 现在,我想用apachemahout对所有向量执行K-Means聚类,但是我收到了错误“不是SequenceFile” 如何创建格式符合mahout要求的文件?也许这就是您要寻找的:

我创建了大文本文件(4GB),如下所示

0 1 2 3 2 1
3 6 2 0 6 4
3 0 6 3 0 0
1 6 7 3 9 4
每行描述一个向量,每列表示向量的每个元素。每个元素由一个空格分隔

现在,我想用apachemahout对所有向量执行K-Means聚类,但是我收到了错误
“不是SequenceFile”


如何创建格式符合mahout要求的文件?

也许这就是您要寻找的: