Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/300.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python scikit学习可以处理数据中的NaN的分类器?_Python_Machine Learning_Scikit Learn_Nan - Fatal编程技术网

Python scikit学习可以处理数据中的NaN的分类器?

Python scikit学习可以处理数据中的NaN的分类器?,python,machine-learning,scikit-learn,nan,Python,Machine Learning,Scikit Learn,Nan,是否有任何scikit学习分类器可以处理数据中的NaN p、 我知道。不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻 您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻 您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补 您不能修改数据以将NAN转换为0s吗?或者这会影响学习阶段吗?您实际使用的

是否有任何scikit学习分类器可以处理数据中的NaN


p、 我知道。

不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻


您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补

不,你为什么要喂一个模特?你希望模型做什么?南没有任何意义。所有带NaN的数学只会传播更多NaN,结果会是一团乱麻


您所能做的就是将其视为缺少的值,并按照您所引用的方法进行插补

您不能修改数据以将NAN转换为0s吗?或者这会影响学习阶段吗?您实际使用的是哪种分类器?您不能修改数据以将NaN转换为0s吗?或者这会影响学习阶段吗?你实际使用的是哪种分类器?嗯,这远不是真的。NaN应被视为缺少值,并且有一些分类器能够比通过插补(这在统计上并不合理)更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值,不幸的是,不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理,因为它们没有任何意义。有些模型支持缺失值,但NaN并不意味着缺失。它可以用来作为失踪的地方持有人,但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化,但是您有一个始终相同的特性,那么您将得到NaN。这并不意味着它不见了。在scikit learn中,正如我所说的,对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失,我不会对其进行插补,但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法,因为它们不是天然的。南不是一个数字,它们在真正的数学中并不存在。它们是我们创建的一个结构,这样我们就可以给一些奇怪的东西(比如除以零)一个返回值。为什么你的数据中有NAN是一个更大的问题,你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己来解释。这远远不是真的。NaN应被视为缺少值,并且有一些分类器能够比通过插补(这在统计上并不合理)更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值,不幸的是,不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理,因为它们没有任何意义。有些模型支持缺失值,但NaN并不意味着缺失。它可以用来作为失踪的地方持有人,但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化,但是您有一个始终相同的特性,那么您将得到NaN。这并不意味着它不见了。在scikit learn中,正如我所说的,对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失,我不会对其进行插补,但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法,因为它们不是天然的。南不是一个数字,它们在真正的数学中并不存在。它们是我们创建的一个结构,这样我们就可以给一些奇怪的东西(比如除以零)一个返回值。为什么你的数据中有NAN是一个更大的问题,你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己解释。