Artificial intelligence ';相似性';在数据挖掘中

Artificial intelligence ';相似性';在数据挖掘中,artificial-intelligence,data-mining,similarity,Artificial Intelligence,Data Mining,Similarity,在数据挖掘领域,是否有一个称为“相似性”的特定子学科?如果是,它处理的是什么。任何例子,链接,参考资料都会很有帮助 另外,作为这个领域的新手,我想听听社区对数据挖掘和人工智能的密切关系的看法。它们是同义词吗?一个是另一个的子集吗 提前感谢您分享您的知识。适当的“相似性”定义(您提取哪些特征,之后如何处理它们)几乎就是聚类的定义,而聚类是数据挖掘的一个相当广泛的子领域 如果你把人工智能的标准愤世嫉俗定义为我们不能很好地解决的一组问题(事实上,我们不能很好地指定这些问题来开始解决),那么一旦你寻找相

在数据挖掘领域,是否有一个称为“相似性”的特定子学科?如果是,它处理的是什么。任何例子,链接,参考资料都会很有帮助

另外,作为这个领域的新手,我想听听社区对数据挖掘和人工智能的密切关系的看法。它们是同义词吗?一个是另一个的子集吗


提前感谢您分享您的知识。

适当的“相似性”定义(您提取哪些特征,之后如何处理它们)几乎就是聚类的定义,而聚类是数据挖掘的一个相当广泛的子领域

如果你把人工智能的标准愤世嫉俗定义为我们不能很好地解决的一组问题(事实上,我们不能很好地指定这些问题来开始解决),那么一旦你寻找相关性的空间开始超出你的算法所能处理的范围,数据挖掘就会进入其中

在数据挖掘领域,是否有一个称为“相似性”的特定子学科

对。数据挖掘和机器学习中有一个特定的子领域称为度量学习,其目的是在数据实例之间学习更好的距离度量

你知道以下任何一个概念吗

核函数

在你了解这些之后,你就会知道什么是“相似性”

我想听听社区对数据挖掘和人工智能的密切关系的看法


很难区分什么是数据挖掘,什么是人工智能。当你是这个领域的新手时,不要讨论这个问题。当你学习了10种数据挖掘算法并阅读了一些人工智能书籍后,你就会知道它们之间的区别和联系

只是强调“相似性”概念的重要性


数据挖掘(AI、机器学习、建模等)是将某些功能发挥到最大或最小值。如果使用最好的优化/学习/挖掘算法,使用错误的函数,则会得到完全的垃圾。请注意,我们使用“值”而不是“值”。这是因为(据我所知)没有(计算或其他)算法能够优化多个值。然而,在我们的宇宙中,复杂的优化比一维优化更频繁(我们想要富有、年轻和健康)。这就是为什么存在过多的相似性和其他评分函数的原因。这就是为什么没有一个是“正确的”

相似性是一个概念,用于一些数据挖掘任务,如聚类、分类。根据您拥有的数据类型,您可能会使用不同的相似性度量,例如文本文档的余弦相似性、欧几里得距离等

数据挖掘中使用了大量相似性度量。在文本挖掘中,寻找文本中的相似度、余弦相似度、jaccard相似度得到了广泛的应用

作为参考,您可以查看raghavan和amnnings信息检索书籍

相关内容: