Hadoop 我想通过mahout mapreduce作业得到距离矩阵

Hadoop 我想通过mahout mapreduce作业得到距离矩阵,hadoop,mapreduce,mahout,Hadoop,Mapreduce,Mahout,我有这些输入文件 id, feature1, feature2, ... 0, 0, 1, 1, 0, 0, 0, ... 1, 0, 0, 1, 0, 1, 0, ... 2, 1, 0, 0, 0, 0, 0, ... 3, 0, 0, 0, 0, 1, 0, ... 我想通过hadoop或mahout使用mapreduce作业计算它的距离矩阵。 但mahout并没有计算距离矩阵的方法。 我该怎么办 谢谢您的帮助。您可以使用Mahout自己计算每条记录之间的距离。 使用的距离方法,但必须先

我有这些输入文件

id, feature1, feature2, ...
0, 0, 1, 1, 0, 0, 0, ...
1, 0, 0, 1, 0, 1, 0, ...
2, 1, 0, 0, 0, 0, 0, ...
3, 0, 0, 0, 0, 1, 0, ...
我想通过hadoop或mahout使用mapreduce作业计算它的距离矩阵。 但mahout并没有计算距离矩阵的方法。 我该怎么办


谢谢您的帮助。

您可以使用Mahout自己计算每条记录之间的距离。
使用的距离方法,但必须先将输入文件转换为SequenceFile。

通过mapreduce,DistanceMeasure类可以使用?(输入文件已转换为SequenceFile)