Python 将h2o数据帧中的所有空值有效替换为0

Python 将h2o数据帧中的所有空值有效替换为0,python,if-statement,null,h2o,Python,If Statement,Null,H2o,我正在寻找一种简单有效的方法来替换H2O Python数据帧中的所有特定值。在这种情况下,该值为NULL。我的数据集包含大量的空值 当我在一个非常大的数据集中有数百列时,我目前的处理方式非常慢。我想如果用更好的方式做这件事,会有实质性的改进 我就是搞不懂语法。谢谢,这将节省我大量的时间 我目前的做法是: for each_col in table_names_list: h2o_df[h2o_df[each_col].isna(), each_col]=0 在NAs的特殊情况下,您可以

我正在寻找一种简单有效的方法来替换H2O Python数据帧中的所有特定值。在这种情况下,该值为NULL。我的数据集包含大量的空值

当我在一个非常大的数据集中有数百列时,我目前的处理方式非常慢。我想如果用更好的方式做这件事,会有实质性的改进

我就是搞不懂语法。谢谢,这将节省我大量的时间

我目前的做法是:

for each_col in table_names_list:
    h2o_df[h2o_df[each_col].isna(), each_col]=0

在NAs的特殊情况下,您可以使用该方法将所有这些值替换为单个值(或者,您可以输入列的平均值、中位数或模式)。以下是一个例子:

import h2o

h2o.init()

df = h2o.H2OFrame([[1,2,3],[4,5,6]])
df.insert_missing_values(fraction=0.5, seed=1)
因此,框架将如下所示:

  C1    C2    C3
----  ----  ----
 nan   nan     3
 nan     5   nan
  C1    C2    C3
----  ----  ----
   0     0     3
   0     5     0
现在我们可以通过值进行插补,但是我们需要传递一个值列表,该列表的长度与列数相同(在您的例子中,所有值都是零)

现在,框架如下所示:

  C1    C2    C3
----  ----  ----
 nan   nan     3
 nan     5   nan
  C1    C2    C3
----  ----  ----
   0     0     3
   0     5     0

在NAs的特殊情况下,您可以使用该方法将所有这些值替换为单个值(或者,您可以输入列的平均值、中位数或模式)。以下是一个例子:

import h2o

h2o.init()

df = h2o.H2OFrame([[1,2,3],[4,5,6]])
df.insert_missing_values(fraction=0.5, seed=1)
因此,框架将如下所示:

  C1    C2    C3
----  ----  ----
 nan   nan     3
 nan     5   nan
  C1    C2    C3
----  ----  ----
   0     0     3
   0     5     0
现在我们可以通过值进行插补,但是我们需要传递一个值列表,该列表的长度与列数相同(在您的例子中,所有值都是零)

现在,框架如下所示:

  C1    C2    C3
----  ----  ----
 nan   nan     3
 nan     5   nan
  C1    C2    C3
----  ----  ----
   0     0     3
   0     5     0
如何仅为一列计算缺失值(我的DF中没有看到'nan')?谢谢。如何仅为一列计算缺失值(我的DF中没有看到'nan')?谢谢