Data mining 兴趣度?

Data mining 兴趣度?,data-mining,Data Mining,有人能解释一下在数据挖掘中项目集的趣味性度量是什么意思吗 谷歌的搜索结果并不是对理解很有帮助。 多谢各位 谷歌的网页排名认为,引用其他网页最多的网页是最有趣的。这是页面排名工作方式的一个粗略简化,但它是衡量有趣程度的一个例子 这是一个由你想象出来的指标。有很多,;在不同的情况下,有些网页比其他网页工作得更好。谷歌的网页排名认为,引用其他网页最多的网页是最有趣的。这是页面排名工作方式的一个粗略简化,但它是衡量有趣程度的一个例子 这是一个由你想象出来的指标。有很多,;在不同的情况下,某些项集挖掘比其

有人能解释一下在数据挖掘中项目集的趣味性度量是什么意思吗

谷歌的搜索结果并不是对理解很有帮助。
多谢各位

谷歌的网页排名认为,引用其他网页最多的网页是最有趣的。这是页面排名工作方式的一个粗略简化,但它是衡量有趣程度的一个例子


这是一个由你想象出来的指标。有很多,;在不同的情况下,有些网页比其他网页工作得更好。

谷歌的网页排名认为,引用其他网页最多的网页是最有趣的。这是页面排名工作方式的一个粗略简化,但它是衡量有趣程度的一个例子


这是一个由你想象出来的指标。有很多,;在不同的情况下,某些项集挖掘比其他项集挖掘效果更好。

项集挖掘的目标是找到在一组事务中经常出现的有趣模式。项目集挖掘中的模式是一组项目

可以有很多模式。为了自动评估哪些模式有趣,哪些不有趣,项集挖掘算法使用了兴趣度度量

在项集挖掘中,最初的度量是“支持度”。它只是一组项目在事务数据库中发生的次数

还有许多其他措施可以使用。例如,在关联规则挖掘中,可以使用提升、置信度、全置信度、余弦等度量


关于兴趣度度量的更多细节,我推荐Tan&Kumar&Steinbach的书,这本书在他们的网站上有一个免费的章节,讨论了关联规则挖掘中几种兴趣度度量的优点(与项集挖掘相关,因为项集用于生成规则).

项集挖掘的目标是找到一组事务中经常出现的有趣模式。项目集挖掘中的模式是一组项目

可以有很多模式。为了自动评估哪些模式有趣,哪些不有趣,项集挖掘算法使用了兴趣度度量

在项集挖掘中,最初的度量是“支持度”。它只是一组项目在事务数据库中发生的次数

还有许多其他措施可以使用。例如,在关联规则挖掘中,可以使用提升、置信度、全置信度、余弦等度量


关于兴趣度度量的更多细节,我推荐Tan&Kumar&Steinbach的书,这本书在他们的网站上有一个免费的章节,讨论了关联规则挖掘中几种兴趣度度量的优点(与项集挖掘相关,因为项集用于生成规则)。

事实上,谷歌的成功很大程度上取决于它的趣味性公式“比其他人工作得更好”:-)谷歌搜索毫无帮助,这是多么讽刺啊。我想问题是OP不知道他们在找什么。我明白了。那么,如果我把下面三组东西,ABC,AB,AC,放在这里出现最多的元素,A,是不是一个很好的有趣的衡量标准?显然不是。我个人的兴趣水平是零。你需要另一个衡量标准。事实上,谷歌的成功很大程度上取决于它的趣味性公式“比其他人更好”:-)谷歌搜索毫无帮助,这是多么讽刺。我想问题是OP不知道他们在找什么。我明白了。那么,如果我把下面三组东西,ABC,AB,AC,放在这里出现最多的元素,A,是不是一个很好的有趣的衡量标准?显然不是。我个人的兴趣水平是零。你需要另一个度量。