Amazon redshift amazon红移推荐引擎的mahout数据模型_Amazon Redshift_Mahout Recommender

Amazon redshift amazon红移推荐引擎的mahout数据模型

amazon-redshift

Amazon redshift amazon红移推荐引擎的mahout数据模型,amazon-redshift,mahout-recommender,Amazon Redshift,Mahout Recommender,如何使用amazon Redshift作为数据源构建推荐引擎。除了少数受支持的NoSQL数据库和JDBC数据库外，amazon Redshift或S3是否有mahout数据模型。Hadoop也可以使用S3。您必须将Hadoop配置为使用S3文件系统，然后Mahout可以很好地读取和写入S3 Redshift是一种基于Postgres并支持JDBC/ODBC的数据仓库解决方案。Mahout 0.9支持存储在JDBC兼容存储区中的数据模型，因此，尽管我没有这样做，但应该支持它 Mahout v1推荐

如何使用amazon Redshift作为数据源构建推荐引擎。除了少数受支持的NoSQL数据库和JDBC数据库外，amazon Redshift或S3是否有mahout数据模型。Hadoop也可以使用S3。您必须将Hadoop配置为使用S3文件系统，然后Mahout可以很好地读取和写入S3

Redshift是一种基于Postgres并支持JDBC/ODBC的数据仓库解决方案。Mahout 0.9支持存储在JDBC兼容存储区中的数据模型，因此，尽管我没有这样做，但应该支持它

Mahout v1推荐程序在Spark上运行，默认情况下输入和输出为文本。所有的I/O都要通过Hadoop。因此，S3数据可以输入，但创建的模型也是文本，需要使用Solr或Elasticsearch等搜索引擎进行索引和查询。您可以非常轻松地编写一个读卡器从任何其他存储（红移）获取数据，但您可能不想将模型保存在数据仓库中，因为它们需要由solr索引，并且应该具有超快速搜索引擎样式的检索。

谢谢pferrel。我的数据在sql server中，我们在redshift上构建数据仓库。我们没有使用Hadoop、EMR集群。我们希望使用mahout进行实时（或近实时）推荐。请给我一些想法，我的技术集是（红移、sql server、S3、mahout、R）。NRT推荐，使用mahout v1（使用Spark）+Solr或Elasticsearch。在运行时，查询是当前用户对Solr的首选项历史记录，速度非常快，这将返回一个有序的要推荐的项列表。您在Solr中索引的模型是由Mahout v1“spark itemsimilarity”创建的参考文献：演示文稿和博客文章：关于主题的简短书籍：