Testing 如何获取或生成推荐系统的测试数据

Testing 如何获取或生成推荐系统的测试数据,testing,system,mahout,test-data,Testing,System,Mahout,Test Data,我目前正在研究,想知道其他研究人员如何获取或生成测试数据来评估系统的性能 我不知道你在评估哪个领域,但如果是电影推荐,你可以使用from开始。(看起来他们的网站暂时关闭了,但我相信很快就会恢复) 他们有三组数据——10万张选票(首选项)、100万张选票和1000万张选票——似乎它们或多或少都是每个人开始使用的标准。当我使用推荐系统时,我遇到了完全相同的问题。我最喜欢Grouplens数据集: 你可以下载用户对电影的评价 此外,我在博客中描述了我在研究过程中发现的一些数据集: 希望有帮助 太棒

我目前正在研究,想知道其他研究人员如何获取或生成测试数据来评估系统的性能

我不知道你在评估哪个领域,但如果是电影推荐,你可以使用from开始。(看起来他们的网站暂时关闭了,但我相信很快就会恢复)


他们有三组数据——10万张选票(首选项)、100万张选票和1000万张选票——似乎它们或多或少都是每个人开始使用的标准。

当我使用推荐系统时,我遇到了完全相同的问题。我最喜欢Grouplens数据集:

你可以下载用户对电影的评价

此外,我在博客中描述了我在研究过程中发现的一些数据集:


希望有帮助

太棒了!谢谢你的信息。如果人们正在寻找一个基于项目而不是基于评分的数据集,会怎么样?例如,协同过滤与内容过滤/项目过滤/信息检索。你是什么意思?Grouplens集也可用于协同过滤。