Java 如何通过查找精确性和召回率来评估从训练数据集生成的关联规则与R中的测试数据集?

Java 如何通过查找精确性和召回率来评估从训练数据集生成的关联规则与R中的测试数据集?,java,r,machine-learning,data-mining,Java,R,Machine Learning,Data Mining,我目前正在数据挖掘中使用关联分类规则。我不知道如何为R中的apriori包生成的一组多标签关联规则生成混淆矩阵。建议我为R中的关联规则生成混淆矩阵的方法,或其他一些评估方法,以根据测试数据集评估生成的关联规则,并找到其精度和召回率 提前感谢。与分类不同的关联规则不会使用混淆矩阵进行评估,因为没有类别标签,而是使用支持度、置信度和提升度量来确定规则的重要性。如果您真的想使用类似分类的度量进行评估,请参考 这确实取决于数据集和预期结果。可能您应该明确指定您的用例。如何根据测试数据集验证从训练数据集获

我目前正在数据挖掘中使用关联分类规则。我不知道如何为R中的apriori包生成的一组多标签关联规则生成混淆矩阵。建议我为R中的关联规则生成混淆矩阵的方法,或其他一些评估方法,以根据测试数据集评估生成的关联规则,并找到其精度和召回率


提前感谢。

与分类不同的关联规则不会使用混淆矩阵进行评估,因为没有类别标签,而是使用支持度、置信度和提升度量来确定规则的重要性。如果您真的想使用类似分类的度量进行评估,请参考

这确实取决于数据集和预期结果。可能您应该明确指定您的用例。如何根据测试数据集验证从训练数据集获得的规则,并找到其精度和召回率。我考虑的数据集是股票市场数据集。非常感谢。内容很有用,但是否有任何可能的方法根据测试数据集评估生成的规则确保它是否正确预测类标签,因为“我的规则”是关联分类规则,且类标签位于后续部分。如果您使用的是A1、A2、…、形式的规则关联分类⇒ ci,其中ci是类标签,则您可以拥有一个保留数据集,并使用传统验证方法计算保留数据集上规则的精度、召回率、准确度和混淆矩阵,例如,计算验证数据集中具有标签ci的数据点的A1、A2、A1和A2比例,…一份礼物。我不太熟悉,你能给我推荐一些可用的验证方法吗!提前感谢。只需将数据集随机分成两部分,例如70%的培训,30%的验证。在第一部分培训分类器,以学习类标签和项集作为特征的规则。现在在另一个数据集上,通过计算精度、召回率、F-均值、准确度、ROC曲线的AUC等来计算规则的性能。。您可以将该过程重复到不同的随机选择的数据折叠中并进行交叉验证。我已经重新配置了apriori算法,以编程方式生成类关联规则。我没有使用任何分类器生成汽车。现在我正在使用R进行评估部分。在R中,我们在arules包中使用了apriori方法,该方法需要datasettraining设置为输入并生成关联规则。正如您所建议的,R中可以使用什么方法来计算这些规则的精度、召回率和F度量值。据我所知,我无法找到任何显式方法来计算类关联规则的这些度量值。提前感谢!