Artificial intelligence 决策树。噪音控制策略

Artificial intelligence 决策树。噪音控制策略,artificial-intelligence,data-mining,decision-tree,Artificial Intelligence,Data Mining,Decision Tree,在决策树中有哪些好的抗噪声策略 在我的训练数据中 我有两个属性相同的记录,但它们的分类不同 女性,奢华,LV,是的 女,豪华,LV,无 根据我的阅读,它说返回这两个记录的多个分类 但是当我想做一个预测时,这会产生一个问题,因为我的预测的输出应该是是或不是 所以,试着找出在这种情况下我可以用什么策略来预测 谢谢。当课程预测尚未确定时: 最简单(也是最常见)的方法是预测大多数人群 获取更多信息。例如,包括其他属性(如果可用)或获取更多训练样本(如果可用) 删除一些信息。其目的是尽可能多地去除噪声源,

在决策树中有哪些好的抗噪声策略

在我的训练数据中

我有两个属性相同的记录,但它们的分类不同

  • 女性,奢华,LV,是的
  • 女,豪华,LV,无
  • 根据我的阅读,它说返回这两个记录的多个分类

    但是当我想做一个预测时,这会产生一个问题,因为我的预测的输出应该是是或不是

    所以,试着找出在这种情况下我可以用什么策略来预测


    谢谢。

    当课程预测尚未确定时:

  • 最简单(也是最常见)的方法是预测大多数人群
  • 获取更多信息。例如,包括其他属性(如果可用)或获取更多训练样本(如果可用)
  • 删除一些信息。其目的是尽可能多地去除噪声源,同时尽可能多地保留预测信息。通常,它是通过删除无用的属性来完成的。就树木而言,可以通过修剪来完成。最终,您可以删除异常值(如错误测量的样本),但您必须知道哪个样本是异常值
    备选方案:1。消除这些矛盾,。添加更多用于决策的属性,即
    女性、豪华、LV
    ,应补充额外的消歧功能,带来两个不同的选择器-一个用于
    ,一个用于
    。3.你能负担得起一种模糊方法吗?这种方法将概率存储为决策,而不是具体的
    yes
    no
    ?修剪处理非类属性中的噪声,而叶子中的概率处理不明确的类。@Stan。这是一项作业,所以我不能说问题设置得有多糟糕。非常感谢。然而,即使在作业中,您也可以检测到通常应视为不一致的数据,并将其跳过决策/建议。至少,这是一种现实的方法。