Hadoop 将空格分隔的文件(每行=矢量)转换为SequenceFile
我创建了大文本文件(4GB),如下所示Hadoop 将空格分隔的文件(每行=矢量)转换为SequenceFile,hadoop,mahout,sequencefile,Hadoop,Mahout,Sequencefile,我创建了大文本文件(4GB),如下所示 0 1 2 3 2 1 3 6 2 0 6 4 3 0 6 3 0 0 1 6 7 3 9 4 每行描述一个向量,每列表示向量的每个元素。每个元素由一个空格分隔 现在,我想用apachemahout对所有向量执行K-Means聚类,但是我收到了错误“不是SequenceFile” 如何创建格式符合mahout要求的文件?也许这就是您要寻找的:
0 1 2 3 2 1
3 6 2 0 6 4
3 0 6 3 0 0
1 6 7 3 9 4
每行描述一个向量,每列表示向量的每个元素。每个元素由一个空格分隔
现在,我想用apachemahout对所有向量执行K-Means聚类,但是我收到了错误“不是SequenceFile”
如何创建格式符合mahout要求的文件?也许这就是您要寻找的: