Mahout是基于Hadoop构建的,这意味着什么?

Mahout是基于Hadoop构建的,这意味着什么?,hadoop,mahout,Hadoop,Mahout,我已经读到Mahout是在Hadoop上开发的,我们可以使用带Hadoop或不带Hadoop的Mahout。说Mahout算法可以在Hadoop上运行是什么意思?Mahout算法不是以Map Reduce的形式编写的,对吗?你能用一个例子给我解释一下吗 谢谢 你看过源代码了吗?这些算法被实现为Map/Reduce作业(不是全部,而是大部分),这正是为什么要这样说。Mahout有两个版本:非分布式和分布式。有一些基本的分布式(Hadoop)实现,比如基于项目的协同过滤。默认分布的限制是,如果您的评

我已经读到Mahout是在Hadoop上开发的,我们可以使用带Hadoop或不带Hadoop的Mahout。说Mahout算法可以在Hadoop上运行是什么意思?Mahout算法不是以Map Reduce的形式编写的,对吗?你能用一个例子给我解释一下吗


谢谢

你看过源代码了吗?这些算法被实现为Map/Reduce作业(不是全部,而是大部分),这正是为什么要这样说。

Mahout有两个版本:非分布式和分布式。有一些基本的分布式(Hadoop)实现,比如基于项目的协同过滤。默认分布的限制是,如果您的评级数据的userid和item id为字母数字,则需要对其进行自定义

如果您想要实现一些自定义算法,那么您必须编写映射器和还原器,甚至是调用它们的代码

我已经覆盖了org.apache.mahout.cf.taste.hadoop.item.RecommenderJob以使用我的自定义映射和减少任务


如果我错了,请大家纠正我

我浏览了GenericUserBasedRecommitder的代码,发现它不是Map Reduce格式,这是否意味着它没有在Hadoop上实现?在这种情况下,我可以理解GenericUserBasedRecommiter是一个普通的Java代码,我可以将其转换为Map Reduce代码并在Hadoop上运行。请让我知道我的理解是否正确。也有基于Hadoop的版本。你想写什么就写什么