Python 不预测零的随机森林
我在一个包含很多零的数据集上运行一个随机林。这些零表示某物的计数(或不存在),因此与可归类为“缺失”的数据相比,它们是有意义的Python 不预测零的随机森林,python,random-forest,prediction,missing-data,zero,Python,Random Forest,Prediction,Missing Data,Zero,我在一个包含很多零的数据集上运行一个随机林。这些零表示某物的计数(或不存在),因此与可归类为“缺失”的数据相比,它们是有意义的 当我运行预测时,我发现我的RF似乎不愿意预测零,几乎就像它没有将0视为一个数字,因此默认为1。有什么办法可以解决这个问题吗?我只是觉得奇怪,零在任何时候都不会作为预测出现 这对我来说并不奇怪,但这取决于您的数据集。 基本上,随机森林的输出是训练值的平均值(若你们不知道它是如何计算的,我邀请你们寻找一些理论来帮助你们理解随机森林是如何计算的…)。因此,除非您的目标几乎完全
当我运行预测时,我发现我的RF似乎不愿意预测零,几乎就像它没有将0视为一个数字,因此默认为1。有什么办法可以解决这个问题吗?我只是觉得奇怪,零在任何时候都不会作为预测出现 这对我来说并不奇怪,但这取决于您的数据集。 基本上,随机森林的输出是训练值的平均值(若你们不知道它是如何计算的,我邀请你们寻找一些理论来帮助你们理解随机森林是如何计算的…)。因此,除非您的目标几乎完全由零或非常明确的模式组合而成(例如,如果某个特征具有某些特定值,则目标始终为00),表示大量训练案例,否则将0作为输出的几率非常低 也就是说,如果您的输出预期为整数(例如0),您可以对其进行四舍五入。请提供一个示例