Scikit learn 填充数据集中缺少的值

Scikit learn 填充数据集中缺少的值,scikit-learn,data-science,Scikit Learn,Data Science,我有一个如下的数据集 building_id meter meter_reading primary_use square_feet air_temperature dew_temperature sea_level_pressure wind_direction wind_speed hour day weekend month 0 0 0 NaN 0 7432 25.0 20.0 1019.7 0.0 0.0 0 1

我有一个如下的数据集

building_id meter   meter_reading   primary_use square_feet air_temperature dew_temperature sea_level_pressure  wind_direction  wind_speed  hour    day weekend month
0            0  0   NaN 0   7432    25.0    20.0    1019.7  0.0 0.0 0   1   4   1
1            1  0   NaN 0   2720    25.0    20.0    1019.7  0.0 0.0 0   1   4   1
2            2  0   NaN 0   5376    25.0    20.0    1019.7  0.0 0.0 0   1   4   1
3            3  0   NaN 0   23685   25.0    20.0    1019.7  0.0 0.0 0   1   4   1
4            4  0   NaN 0   116607  25.0    20.0    1019.7  0.0 0.0 0   1   4   1
你可以看到米读数下的值是Nan,我喜欢用“主要用途”和“平方英尺”列分组的平均值来填充它。我可以使用哪个api来实现这一点。我目前正在使用scikit learn的插补器


非常感谢您的帮助。

如果您使用熊猫数据框,它已经为您带来了所需的一切

请注意,
priary\u use
是一种分类功能,而
square\u feet
是连续的。因此,首先您要将
平方英尺
划分为几个类别,以便计算每组的平均
米读数