Data mining 要检索唯一实例的数据挖掘任务是什么

Data mining 要检索唯一实例的数据挖掘任务是什么,data-mining,information-retrieval,Data Mining,Information Retrieval,我从事数据挖掘工作,熟悉分类、聚类和回归任务。在分类中,可以有很多实例,例如动物,它们的特征,例如腿的数量,以及一个类别,例如哺乳动物、爬行动物 但我需要完成的是,给定一些属性,包括class属性,以确定我指的是哪个唯一实例,例如giraffe。我可以提供我所有的已知属性,如果模型不能找到答案,它可以要求另一个属性——就像20个问题的游戏风格一样 所以,我的问题是:这个特定的任务有名字吗?这似乎类似于分类,在分类中,类对于每个实例都是唯一的,但这不适用于当前的训练模型,除了决策树模型。您的输入,

我从事数据挖掘工作,熟悉分类、聚类和回归任务。在分类中,可以有很多实例,例如动物,它们的特征,例如腿的数量,以及一个类别,例如哺乳动物、爬行动物

但我需要完成的是,给定一些属性,包括class属性,以确定我指的是哪个唯一实例,例如giraffe。我可以提供我所有的已知属性,如果模型不能找到答案,它可以要求另一个属性——就像20个问题的游戏风格一样

所以,我的问题是:这个特定的任务有名字吗?这似乎类似于分类,在分类中,类对于每个实例都是唯一的,但这不适用于当前的训练模型,除了决策树模型。

您的输入,表示机器学习中的特征,是物种的元组,我认为您所指的实例和物理属性。您的输出是更广泛的分类等级。因此,为每个输入分配一个是一个分类问题。由于您的功能不完整,您希望执行。。。数据不完整的分类,或插补缺失特征。搜索这些术语将为您提供足够的线索


另一个任务被恰当地称为集群。

我想知道你在寻找什么,仅仅是一个决策树

除了,您没有在类的分类属性上训练它,而是在单个实例标签上训练它


不过,您需要仔细选择拆分度量值,因为许多度量值都适用于类大小,而且您的所有类现在都有大小1。为决策树找到一个好的分割可能需要提前规划一些分割,以获得最佳平衡树。一种类似森林的随机方法可能有助于提高找到一棵好树的机会。

我用这几个术语的变化更新了我的问题。但我认为这并不完全是一个分类问题,因为如果class属性像ID一样是唯一的,您无法训练模型来预测新实例元组属于哪个类。class属性不是与物种相关的分类组吗?我不明白你说它独一无二是什么意思。提问引导学习者回忆的设置。