Python scikit学习可以处理数据中的NaN的分类器？_Python_Machine Learning_Scikit Learn_Nan

Python scikit学习可以处理数据中的NaN的分类器？

python machine-learning scikit-learn

Python scikit学习可以处理数据中的NaN的分类器？,python,machine-learning,scikit-learn,nan,Python,Machine Learning,Scikit Learn,Nan,是否有任何scikit学习分类器可以处理数据中的NaN p、我知道。不，你为什么要喂一个模特？你希望模型做什么？南没有任何意义。所有带NaN的数学只会传播更多NaN，结果会是一团乱麻您所能做的就是将其视为缺少的值，并按照您所引用的方法进行插补不，你为什么要喂一个模特？你希望模型做什么？南没有任何意义。所有带NaN的数学只会传播更多NaN，结果会是一团乱麻您所能做的就是将其视为缺少的值，并按照您所引用的方法进行插补您不能修改数据以将NAN转换为0s吗？或者这会影响学习阶段吗？您实际使用的

是否有任何scikit学习分类器可以处理数据中的NaN

p、我知道。

不，你为什么要喂一个模特？你希望模型做什么？南没有任何意义。所有带NaN的数学只会传播更多NaN，结果会是一团乱麻

您所能做的就是将其视为缺少的值，并按照您所引用的方法进行插补

不，你为什么要喂一个模特？你希望模型做什么？南没有任何意义。所有带NaN的数学只会传播更多NaN，结果会是一团乱麻

您所能做的就是将其视为缺少的值，并按照您所引用的方法进行插补

您不能修改数据以将NAN转换为0s吗？或者这会影响学习阶段吗？您实际使用的是哪种分类器？您不能修改数据以将NaN转换为0s吗？或者这会影响学习阶段吗？你实际使用的是哪种分类器？嗯，这远不是真的。NaN应被视为缺少值，并且有一些分类器能够比通过插补（这在统计上并不合理）更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值，不幸的是，不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理，因为它们没有任何意义。有些模型支持缺失值，但NaN并不意味着缺失。它可以用来作为失踪的地方持有人，但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化，但是您有一个始终相同的特性，那么您将得到NaN。这并不意味着它不见了。在scikit learn中，正如我所说的，对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失，我不会对其进行插补，但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法，因为它们不是天然的。南不是一个数字，它们在真正的数学中并不存在。它们是我们创建的一个结构，这样我们就可以给一些奇怪的东西（比如除以零）一个返回值。为什么你的数据中有NAN是一个更大的问题，你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己来解释。这远远不是真的。NaN应被视为缺少值，并且有一些分类器能够比通过插补（这在统计上并不合理）更好地处理缺失值。例如-决策树/随机林可以完美地处理缺失值，不幸的是，不是scikit learn实现将NaN作为缺失值与建模“处理”NaN不同。NAN不能由模型处理，因为它们没有任何意义。有些模型支持缺失值，但NaN并不意味着缺失。它可以用来作为失踪的地方持有人，但它是一个完全不同的事情。如果您编写了代码来按方差进行规范化，但是您有一个始终相同的特性，那么您将得到NaN。这并不意味着它不见了。在scikit learn中，正如我所说的，对NaN最好的处理方法是将其视为缺失并进行插补——因为这是scikit learn的全部支持。我将NaN视为缺失，我不会对其进行插补，但我希望以@lejlot所说的更自然的方式对其进行处理。没有“更自然的”处理NAN的方法，因为它们不是天然的。南不是一个数字，它们在真正的数学中并不存在。它们是我们创建的一个结构，这样我们就可以给一些奇怪的东西（比如除以零）一个返回值。为什么你的数据中有NAN是一个更大的问题，你应该关注什么。让sklearn在遇到NAN时只返回NAN是非常方便的——让用户自己解释。