Artificial intelligence 决策树。噪音控制策略
在决策树中有哪些好的抗噪声策略 在我的训练数据中 我有两个属性相同的记录,但它们的分类不同Artificial intelligence 决策树。噪音控制策略,artificial-intelligence,data-mining,decision-tree,Artificial Intelligence,Data Mining,Decision Tree,在决策树中有哪些好的抗噪声策略 在我的训练数据中 我有两个属性相同的记录,但它们的分类不同 女性,奢华,LV,是的 女,豪华,LV,无 根据我的阅读,它说返回这两个记录的多个分类 但是当我想做一个预测时,这会产生一个问题,因为我的预测的输出应该是是或不是 所以,试着找出在这种情况下我可以用什么策略来预测 谢谢。当课程预测尚未确定时: 最简单(也是最常见)的方法是预测大多数人群 获取更多信息。例如,包括其他属性(如果可用)或获取更多训练样本(如果可用) 删除一些信息。其目的是尽可能多地去除噪声源,
谢谢。当课程预测尚未确定时:
备选方案:1。消除这些矛盾,。添加更多用于决策的属性,即
女性、豪华、LV
,应补充额外的消歧功能,带来两个不同的选择器-一个用于是
,一个用于否
。3.你能负担得起一种模糊方法吗?这种方法将概率存储为决策,而不是具体的yes
或no
?修剪处理非类属性中的噪声,而叶子中的概率处理不明确的类。@Stan。这是一项作业,所以我不能说问题设置得有多糟糕。非常感谢。然而,即使在作业中,您也可以检测到通常应视为不一致的数据,并将其跳过决策/建议。至少,这是一种现实的方法。