Methods 二次分析与数据挖掘的区别

Methods 二次分析与数据挖掘的区别,methods,statistics,data-mining,spss,Methods,Statistics,Data Mining,Spss,我试图从为其他目的而建立的大型多维数据集中提取某些人口群体的一些消费模式。我正在使用人工方法(SPSS)进行聚类和回归分析。这是二次分析还是数据挖掘?我理解统计分析和数据挖掘之间的区别,但在这种情况下似乎介于两者之间。。。感谢“二次分析”是指为“主要”研究项目A收集数据,但随后为“次要”项目B再次分析数据,其目标与最初计划的目标截然不同。也许很久以后,也许是不同的人。如果你想避免自己做实验的成本,并且其他人已经发布了合适的数据,这在医学上是相当普遍的 一个理论例子: 研究组A对药物B进行临床试验

我试图从为其他目的而建立的大型多维数据集中提取某些人口群体的一些消费模式。我正在使用人工方法(SPSS)进行聚类和回归分析。这是二次分析还是数据挖掘?我理解统计分析和数据挖掘之间的区别,但在这种情况下似乎介于两者之间。。。感谢

“二次分析”是指为“主要”研究项目A收集数据,但随后为“次要”项目B再次分析数据,其目标与最初计划的目标截然不同。也许很久以后,也许是不同的人。如果你想避免自己做实验的成本,并且其他人已经发布了合适的数据,这在医学上是相当普遍的

一个理论例子:

  • 研究组A对药物B进行临床试验,测量体重和胰岛素水平
  • 研究组(含药物B)和对照组(不含药物B)的数据均已公布
  • 。。。十年后
  • 研究小组C想知道体重和胰岛素水平之间是否存在相关性。他们不关心药物B,所以他们只关注对照组。他们将数据与许多其他组的数据结合起来,而不是自己做实验
  • 这不是一项“荟萃”研究,因为他们忽略了与药物B有关的任何结果。他们不使用a组的结果,只使用他们的数据,用于不同的目的。由于这是数据的二次使用,所以称为“二次分析”


    分析可以像计算相关性一样简单——通常不被认为是“数据挖掘”(你不搜索,也不使用高级统计),而是传统的统计假设检验。

    我从未听说过“二次分析”。定义是什么?你是想问统计和数据挖掘的交互作用是什么?请更具体地回答您的问题,因为“二次分析”在这里是一个令人困惑的术语。当然,我是这方面的新手,认为这是一个相当普遍的概念:“二次分析涉及使用为先前研究目的收集的现有数据,以追求不同于原著的研究兴趣;这可能是一个新的研究问题,也可能是对原始问题的另一种观点。在这方面,二次分析不同于定性研究的系统评价和荟萃分析,后者旨在汇编和评估与共同关注的问题或实践领域有关的证据。”(Heaton,1998年),这与数据挖掘本身无关。“二次分析”在这个意义上意味着收集数据是为了“初级”目的研究项目A,但随后又被分析为“次要”项目B,其目标与最初计划的目标截然不同。也许很久以后,也许是不同的人。如果你想避免自己做实验的成本,并且其他人已经发布了合适的数据,这在医学上是很常见的。谢谢你的回答@Anony mouse,但是我不明白为什么这与数据挖掘无关,如果根据定义,你可以使用多个数据集来发现新的模式?这项技术在医学中很常见,但在一般的社会研究(如营销、教育等)中也很常见,涉及到数据预处理、建模/分析和解释。好吧,但假设我想预测,例如,使用一些公共调查的再购买意向,因此,我对有意义的变量进行归一化和汇总,然后使用相关性、聚类和回归分析(一起)来确定最佳预测因子。这将被视为二次分析或数据挖掘?它们是正交概念。有些东西可以两者都有,也可以两者都没有。一个是关于数据的用途,另一个是关于应用的方法。这正是我需要知道的