Hadoop 在ApacheMahout中查找Z分数并计算相似度的编码

Hadoop 在ApacheMahout中查找Z分数并计算相似度的编码,hadoop,mahout,recommendation-engine,mahout-recommender,Hadoop,Mahout,Recommendation Engine,Mahout Recommender,我是apache mahout的新手。我已经设法将其用于pearson相关和余弦向量,但我需要标准化数据并使用Z分数计算相似度。我无法在mahout中找到允许这样做的方法。mahout wiki也没有演示如何使用数据规范化和计算相似度。如果有人能帮我解决同样的问题,我将不胜感激。这些问题最好在mahout用户邮件列表中找到答案 在任何情况下,了解您在更大范围内尝试做什么都是很好的。听起来您可能正在尝试构建一个推荐引擎。如果是这样,皮尔逊相关性通常是一种非常糟糕的方法 最好使用Mahout计算指标

我是apache mahout的新手。我已经设法将其用于pearson相关和余弦向量,但我需要标准化数据并使用Z分数计算相似度。我无法在mahout中找到允许这样做的方法。mahout wiki也没有演示如何使用数据规范化和计算相似度。如果有人能帮我解决同样的问题,我将不胜感激。

这些问题最好在mahout用户邮件列表中找到答案

在任何情况下,了解您在更大范围内尝试做什么都是很好的。听起来您可能正在尝试构建一个推荐引擎。如果是这样,皮尔逊相关性通常是一种非常糟糕的方法

最好使用Mahout计算指标行为,然后使用Solr或ElasticSearch等搜索引擎部署推荐功能

我们在O'Reilly小书中描述了如何做到这一点,您可以从以下网站获得: