Python 将h2o数据帧中的所有空值有效替换为0
我正在寻找一种简单有效的方法来替换H2O Python数据帧中的所有特定值。在这种情况下,该值为NULL。我的数据集包含大量的空值 当我在一个非常大的数据集中有数百列时,我目前的处理方式非常慢。我想如果用更好的方式做这件事,会有实质性的改进 我就是搞不懂语法。谢谢,这将节省我大量的时间 我目前的做法是:Python 将h2o数据帧中的所有空值有效替换为0,python,if-statement,null,h2o,Python,If Statement,Null,H2o,我正在寻找一种简单有效的方法来替换H2O Python数据帧中的所有特定值。在这种情况下,该值为NULL。我的数据集包含大量的空值 当我在一个非常大的数据集中有数百列时,我目前的处理方式非常慢。我想如果用更好的方式做这件事,会有实质性的改进 我就是搞不懂语法。谢谢,这将节省我大量的时间 我目前的做法是: for each_col in table_names_list: h2o_df[h2o_df[each_col].isna(), each_col]=0 在NAs的特殊情况下,您可以
for each_col in table_names_list:
h2o_df[h2o_df[each_col].isna(), each_col]=0
在NAs的特殊情况下,您可以使用该方法将所有这些值替换为单个值(或者,您可以输入列的平均值、中位数或模式)。以下是一个例子:
import h2o
h2o.init()
df = h2o.H2OFrame([[1,2,3],[4,5,6]])
df.insert_missing_values(fraction=0.5, seed=1)
因此,框架将如下所示:
C1 C2 C3
---- ---- ----
nan nan 3
nan 5 nan
C1 C2 C3
---- ---- ----
0 0 3
0 5 0
现在我们可以通过值进行插补,但是我们需要传递一个值列表,该列表的长度与列数相同(在您的例子中,所有值都是零)
现在,框架如下所示:
C1 C2 C3
---- ---- ----
nan nan 3
nan 5 nan
C1 C2 C3
---- ---- ----
0 0 3
0 5 0
在NAs的特殊情况下,您可以使用该方法将所有这些值替换为单个值(或者,您可以输入列的平均值、中位数或模式)。以下是一个例子:
import h2o
h2o.init()
df = h2o.H2OFrame([[1,2,3],[4,5,6]])
df.insert_missing_values(fraction=0.5, seed=1)
因此,框架将如下所示:
C1 C2 C3
---- ---- ----
nan nan 3
nan 5 nan
C1 C2 C3
---- ---- ----
0 0 3
0 5 0
现在我们可以通过值进行插补,但是我们需要传递一个值列表,该列表的长度与列数相同(在您的例子中,所有值都是零)
现在,框架如下所示:
C1 C2 C3
---- ---- ----
nan nan 3
nan 5 nan
C1 C2 C3
---- ---- ----
0 0 3
0 5 0
如何仅为一列计算缺失值(我的DF中没有看到'nan')?谢谢。如何仅为一列计算缺失值(我的DF中没有看到'nan')?谢谢