arules软件包R中利益衡量函数的范围与软件包手册中的描述不同
我正在使用artules package,R来寻找积极相关的产品。我使用function interestMeasure提供的一些度量来评估规则。然而,我发现kappa和LeastContradition测量值的范围与包装手册不同。以下是一个示例,代码在包装手册中的兴趣测量说明中:arules软件包R中利益衡量函数的范围与软件包手册中的描述不同,r,arules,kappa,R,Arules,Kappa,我正在使用artules package,R来寻找积极相关的产品。我使用function interestMeasure提供的一些度量来评估规则。然而,我发现kappa和LeastContradition测量值的范围与包装手册不同。以下是一个示例,代码在包装手册中的兴趣测量说明中: data("Income") rules <- apriori(Income) quality(rules)$kappa <- interestMeasure(rules,measure='kappa',
data("Income")
rules <- apriori(Income)
quality(rules)$kappa <- interestMeasure(rules,measure='kappa',transactions = Income)
quality(rules)$leastContradiction <- interestMeasure(rules,measure='leastContradiction',transactions = Income)
try <- as(rules,'data.frame')
我在自己的数据上尝试了这两种方法,总结如下:
> summary(myData1$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000
> summary(myData1$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-218.9000 -5.4530 -2.0120 -4.9540 -1.1050 0.8824
然而,在包装手册中,这两项措施的解释如下:
人们可以看到范围是非常不同的。那么,我是否应该自己将这些度量的范围缩小到[-1,1]呢?这确实是一个bug。解决方案:在kappa计算中添加缺少的括号,并固定矛盾最小的方程。该修复现在在github的开发版本中可用,并将成为下一版本(arules 1.2-3)的一部分。这里有编程问题吗?是否尝试将值缩放到[-1,1]的间隔?我使用包中提供的所有函数。因此,我不认为存在编程错误。此外,第一个示例来自arules软件包手册中感兴趣的测量功能部分。你可以看到我只改变了一点点,这不会改变结果。如果必须将值缩放到[-1,1],我就可以了。我只是不明白手册上说这些度量值的范围是[-1,1],而代码给出了不同的答案。我想你应该联系软件包维护人员或作者。我会试试。谢谢你的建议看起来像个虫子。我在这里提出了一个问题
> summary(myData1$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000
> summary(myData1$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-218.9000 -5.4530 -2.0120 -4.9540 -1.1050 0.8824