Dataframe 如何找到丢失的口罩?

Dataframe 如何找到丢失的口罩?,dataframe,missing-data,fancyimpute,Dataframe,Missing Data,Fancyimpute,我试着跟着 缺少什么_掩码?如何从缺少值的数据帧中获取它 缺少的掩码是一个布尔数组或一组索引,其中缺少数据。例如,假设您有一个数组,其中缺少一些值,如下所示 [12] [3 NA] 缺失的掩码将是另一个布尔数组,其中数据缺失处的条目为真。在这种情况下,它将是: [假] [假-真] 有关pandas中的相关功能,请参见本页 如果要在原始数据集上创建缺少的掩码,可以使用df.isna()或df.isnull() 但是,在您的情况下,这个过程是不相关的。您已经拥有缺少值的数据集。只需在这个数据集上运

我试着跟着


缺少什么_掩码?如何从缺少值的数据帧中获取它

缺少的掩码是一个布尔数组或一组索引,其中缺少数据。例如,假设您有一个数组,其中缺少一些值,如下所示

[12] [3 NA]

缺失的掩码将是另一个布尔数组,其中数据缺失处的条目为真。在这种情况下,它将是:

[假] [假-真]

有关pandas中的相关功能,请参见本页

如果要在原始数据集上创建缺少的掩码,可以使用df.isna()或df.isnull()

但是,在您的情况下,这个过程是不相关的。您已经拥有缺少值的数据集。只需在这个数据集上运行插补。FancyComputer手册中缺少的掩码仅适用于您可能希望计算性能指标或人工创建缺少值的数据集,然后对其执行插补的情况

希望这是有益的,祝你好运

# print mean squared error for the four imputation methods above
ii_mse = ((X_filled_ii[missing_mask] - X[missing_mask]) ** 2).mean()
print("Iterative Imputer norm minimization MSE: %f" % ii_mse)

nnm_mse = ((X_filled_nnm[missing_mask] - X[missing_mask]) ** 2).mean()
print("Nuclear norm minimization MSE: %f" % nnm_mse)

softImpute_mse = ((X_filled_softimpute[missing_mask] - X[missing_mask]) ** 2).mean()
print("SoftImpute MSE: %f" % softImpute_mse)

knn_mse = ((X_filled_knn[missing_mask] - X[missing_mask]) ** 2).mean()
print("knnImpute MSE: %f" % knn_mse)