Dataframe 如何处理数据集中缺少的值_Dataframe_Machine Learning_Data Science

Dataframe 如何处理数据集中缺少的值

dataframe machine-learning

Dataframe 如何处理数据集中缺少的值,dataframe,machine-learning,data-science,Dataframe,Machine Learning,Data Science,我有一个简单的分类问题，我正试图通过使用keras的神经网络来解决这个问题。有一个大小为26000*17的数字数据集。但问题是，数据集中有很多缺失值（空值）。数据非常敏感，因此我既不能忽略所有包含空值的行，也不能用平均值、平均值或任何标准值替换数据中的空值。也存在不使用KNN插补替换缺失条目的限制。处理此类数据集的最佳方法是什么我不知道你的数据有多重要。顺便说一句，没有这样好的方法来处理丢失的值。当然，您必须通过查找平均值或平均值或任何标准数字（例如0）来处理它。KNN插补被认为是最好的方法

我有一个简单的分类问题，我正试图通过使用keras的神经网络来解决这个问题。有一个大小为26000*17的数字数据集。但问题是，数据集中有很多缺失值（空值）。数据非常敏感，因此我既不能忽略所有包含空值的行，也不能用平均值、平均值或任何标准值替换数据中的空值。也存在不使用KNN插补替换缺失条目的限制。

处理此类数据集的最佳方法是什么

我不知道你的数据有多重要。顺便说一句，没有这样好的方法来处理丢失的值。当然，您必须通过查找平均值或平均值或任何标准数字（例如0）来处理它。KNN插补被认为是最好的方法，但不知道为什么存在不使用KNN插补的限制

替换任何类型数值数据集中缺失值的最佳方法是KNN插补，它通过考虑相邻条目来替换缺失值

如果他们给你一个空值，那么他们不会给你数据。如果你需要真实的数据来做任何有用的事情，那么你不能处理空值，句号。你不能“分类”你不知道的东西，空值是你不知道的东西，句号。丢失数据的百分比是多少？您可以尝试上采样，可能会在复制样本中添加少量噪声。然而，如果存在大量缺失值，则所有这些都不可能是富有成效的做法。OP明确提到不使用k-nn插补存在限制