Python scikit学习可以处理数据中的NaN的分类器?
是否有任何scikit学习分类器可以处理数据中的NaNPython scikit学习可以处理数据中的NaN的分类器?,python,machine-learning,scikit-learn,nan,Python,Machine Learning,Scikit Learn,Nan,是否有任何scikit学习分类器可以处理数据中的NaN p、 我知道。不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻 您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻 您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 您不能修改数据以将NAN转换为0s吗?或者这会影响学习阶段吗?您实际使用的
p、 我知道。不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻
您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻
您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 您不能修改数据以将NAN转换为0s吗?或者这会影响学习阶段吗?您实际使用的是哪种分类器?您不能修改数据以将NaN转换为0s吗?或者这会影响学习阶段吗?你实际使用的是哪种分类器?嗯,这远不是真的。NaN应被视为缺少值,并且有一些分类器能够比通过插补(这在统计上并不合理)更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值,不幸的是,不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理,因为它们没有任何意义。有些模型支持缺失值,但NaN并不意味着缺失。它可以用来作为失踪的地方持有人,但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化,但是您有一个始终相同的特性,那么您将得到NaN。这并不意味着它不见了。在scikit learn中,正如我所说的,对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失,我不会对其进行插补,但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法,因为它们不是天然的。南不是一个数字,它们在真正的数学中并不存在。它们是我们创建的一个结构,这样我们就可以给一些奇怪的东西(比如除以零)一个返回值。为什么你的数据中有NAN是一个更大的问题,你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己来解释。这远远不是真的。NaN应被视为缺少值,并且有一些分类器能够比通过插补(这在统计上并不合理)更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值,不幸的是,不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理,因为它们没有任何意义。有些模型支持缺失值,但NaN并不意味着缺失。它可以用来作为失踪的地方持有人,但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化,但是您有一个始终相同的特性,那么您将得到NaN。这并不意味着它不见了。在scikit learn中,正如我所说的,对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失,我不会对其进行插补,但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法,因为它们不是天然的。南不是一个数字,它们在真正的数学中并不存在。它们是我们创建的一个结构,这样我们就可以给一些奇怪的东西(比如除以零)一个返回值。为什么你的数据中有NAN是一个更大的问题,你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己解释。