Dataframe 如何处理数据集中缺少的值

Dataframe 如何处理数据集中缺少的值,dataframe,machine-learning,data-science,Dataframe,Machine Learning,Data Science,我有一个简单的分类问题,我正试图通过使用keras的神经网络来解决这个问题。有一个大小为26000*17的数字数据集。但问题是,数据集中有很多缺失值(空值)。数据非常敏感,因此我既不能忽略所有包含空值的行,也不能用平均值、平均值或任何标准值替换数据中的空值。也存在不使用KNN插补替换缺失条目的限制。 处理此类数据集的最佳方法是什么 我不知道你的数据有多重要。顺便说一句,没有这样好的方法来处理丢失的值。当然,您必须通过查找平均值或平均值或任何标准数字(例如0)来处理它。KNN插补被认为是最好的方法

我有一个简单的分类问题,我正试图通过使用keras的神经网络来解决这个问题。有一个大小为26000*17的数字数据集。但问题是,数据集中有很多缺失值(空值)。数据非常敏感,因此我既不能忽略所有包含空值的行,也不能用平均值、平均值或任何标准值替换数据中的空值。也存在不使用KNN插补替换缺失条目的限制。
处理此类数据集的最佳方法是什么

我不知道你的数据有多重要。顺便说一句,没有这样好的方法来处理丢失的值。当然,您必须通过查找平均值或平均值或任何标准数字(例如0)来处理它。KNN插补被认为是最好的方法,但不知道为什么存在不使用KNN插补的限制

替换任何类型数值数据集中缺失值的最佳方法是KNN插补,它通过考虑相邻条目来替换缺失值

如果他们给你一个空值,那么他们不会给你数据。如果你需要真实的数据来做任何有用的事情,那么你不能处理空值,句号。你不能“分类”你不知道的东西,空值是你不知道的东西,句号。丢失数据的百分比是多少?您可以尝试上采样,可能会在复制样本中添加少量噪声。然而,如果存在大量缺失值,则所有这些都不可能是富有成效的做法。OP明确提到不使用k-nn插补存在限制