Database 聚类分析是按什么顺序进行的?

Database 聚类分析是按什么顺序进行的?,database,cluster-analysis,data-mining,Database,Cluster Analysis,Data Mining,首先从数据库中找到最小频繁模式。 然后将它们划分为各种数据类型,如基于区间的、二进制的、有序变量等,并为所有变量定义各种距离度量。 最后应用聚类分析方法。 这个顺序是对的还是我遗漏了什么?你是否正确取决于你想做什么。您描述的一般方法似乎朝着正确的方向发展,但在回答以下问题之前,您永远不会知道您的目标是否实现: 你的数据是什么 您正在尝试查找什么/希望使用哪种群集方法 从您描述的内容来看,我认为您需要执行“预处理”步骤,如特征选择和矢量化。不幸的是,这本身就具有相当大的挑战性。例如,最大的问题之一

首先从数据库中找到最小频繁模式。
然后将它们划分为各种数据类型,如基于区间的、二进制的、有序变量等,并为所有变量定义各种距离度量。
最后应用聚类分析方法。


这个顺序是对的还是我遗漏了什么?

你是否正确取决于你想做什么。您描述的一般方法似乎朝着正确的方向发展,但在回答以下问题之前,您永远不会知道您的目标是否实现:

  • 你的数据是什么
  • 您正在尝试查找什么/希望使用哪种群集方法
  • 从您描述的内容来看,我认为您需要执行“预处理”步骤,如特征选择和矢量化。不幸的是,这本身就具有相当大的挑战性。例如,最大的问题之一是距离函数的设计(有大量的研究可用)

    因此,请向我们提供有关您的特定目标应用程序的更多信息