Artificial intelligence 决策树。噪音控制策略_Artificial Intelligence_Data Mining_Decision Tree

Artificial intelligence 决策树。噪音控制策略

artificial-intelligence

Artificial intelligence 决策树。噪音控制策略,artificial-intelligence,data-mining,decision-tree,Artificial Intelligence,Data Mining,Decision Tree,在决策树中有哪些好的抗噪声策略在我的训练数据中我有两个属性相同的记录，但它们的分类不同女性，奢华，LV，是的女，豪华，LV，无根据我的阅读，它说返回这两个记录的多个分类但是当我想做一个预测时，这会产生一个问题，因为我的预测的输出应该是是或不是所以，试着找出在这种情况下我可以用什么策略来预测谢谢。当课程预测尚未确定时：最简单（也是最常见）的方法是预测大多数人群获取更多信息。例如，包括其他属性（如果可用）或获取更多训练样本（如果可用）删除一些信息。其目的是尽可能多地去除噪声源，

在决策树中有哪些好的抗噪声策略

在我的训练数据中

我有两个属性相同的记录，但它们的分类不同

女性，奢华，LV，是的

女，豪华，LV，无

根据我的阅读，它说返回这两个记录的多个分类

但是当我想做一个预测时，这会产生一个问题，因为我的预测的输出应该是是或不是

所以，试着找出在这种情况下我可以用什么策略来预测

谢谢。

当课程预测尚未确定时：

最简单（也是最常见）的方法是预测大多数人群

获取更多信息。例如，包括其他属性（如果可用）或获取更多训练样本（如果可用）

删除一些信息。其目的是尽可能多地去除噪声源，同时尽可能多地保留预测信息。通常，它是通过删除无用的属性来完成的。就树木而言，可以通过修剪来完成。最终，您可以删除异常值（如错误测量的样本），但您必须知道哪个样本是异常值

备选方案：1。消除这些矛盾,。添加更多用于决策的属性，即

女性、豪华、LV

，应补充额外的消歧功能，带来两个不同的选择器-一个用于

是

，一个用于

否

。3.你能负担得起一种模糊方法吗？这种方法将概率存储为决策，而不是具体的

yes

或

no

？修剪处理非类属性中的噪声，而叶子中的概率处理不明确的类。@Stan。这是一项作业，所以我不能说问题设置得有多糟糕。非常感谢。然而，即使在作业中，您也可以检测到通常应视为不一致的数据，并将其跳过决策/建议。至少，这是一种现实的方法。