Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/elixir/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon redshift amazon红移推荐引擎的mahout数据模型_Amazon Redshift_Mahout Recommender - Fatal编程技术网

Amazon redshift amazon红移推荐引擎的mahout数据模型

Amazon redshift amazon红移推荐引擎的mahout数据模型,amazon-redshift,mahout-recommender,Amazon Redshift,Mahout Recommender,如何使用amazon Redshift作为数据源构建推荐引擎。除了少数受支持的NoSQL数据库和JDBC数据库外,amazon Redshift或S3是否有mahout数据模型。Hadoop也可以使用S3。您必须将Hadoop配置为使用S3文件系统,然后Mahout可以很好地读取和写入S3 Redshift是一种基于Postgres并支持JDBC/ODBC的数据仓库解决方案。Mahout 0.9支持存储在JDBC兼容存储区中的数据模型,因此,尽管我没有这样做,但应该支持它 Mahout v1推荐

如何使用amazon Redshift作为数据源构建推荐引擎。除了少数受支持的NoSQL数据库和JDBC数据库外,amazon Redshift或S3是否有mahout数据模型。Hadoop也可以使用S3。您必须将Hadoop配置为使用S3文件系统,然后Mahout可以很好地读取和写入S3

Redshift是一种基于Postgres并支持JDBC/ODBC的数据仓库解决方案。Mahout 0.9支持存储在JDBC兼容存储区中的数据模型,因此,尽管我没有这样做,但应该支持它


Mahout v1推荐程序在Spark上运行,默认情况下输入和输出为文本。所有的I/O都要通过Hadoop。因此,S3数据可以输入,但创建的模型也是文本,需要使用Solr或Elasticsearch等搜索引擎进行索引和查询。您可以非常轻松地编写一个读卡器从任何其他存储(红移)获取数据,但您可能不想将模型保存在数据仓库中,因为它们需要由solr索引,并且应该具有超快速搜索引擎样式的检索。

谢谢pferrel。我的数据在sql server中,我们在redshift上构建数据仓库。我们没有使用Hadoop、EMR集群。我们希望使用mahout进行实时(或近实时)推荐。请给我一些想法,我的技术集是(红移、sql server、S3、mahout、R)。NRT推荐,使用mahout v1(使用Spark)+Solr或Elasticsearch。在运行时,查询是当前用户对Solr的首选项历史记录,速度非常快,这将返回一个有序的要推荐的项列表。您在Solr中索引的模型是由Mahout v1“spark itemsimilarity”创建的参考文献:演示文稿和博客文章:关于主题的简短书籍: