Python h2o:遍历行

Python h2o:遍历行,python,h2o,Python,H2o,我知道h2o的内部数据模型是面向列的(即H2OFrame是H2OVec的集合)。但是,我想使用的库需要遍历一个框架的行 有没有一种干净的方法来获取行上的迭代器,或者我需要像这样使用索引 iris = h2o.import_file(path=".../iris_wheader.csv") for i in xrange(iris.nrow): foo( iris[i,:].as_data_frame(use_pandas=False)[1] ) 我知道这会很慢,我正在尽可能使用h2o.

我知道h2o的内部数据模型是面向列的(即H2OFrame是H2OVec的集合)。但是,我想使用的库需要遍历一个框架的行

有没有一种干净的方法来获取行上的迭代器,或者我需要像这样使用索引

iris = h2o.import_file(path=".../iris_wheader.csv")
for i in xrange(iris.nrow):
    foo( iris[i,:].as_data_frame(use_pandas=False)[1] )

我知道这会很慢,我正在尽可能使用
h2o.h2o.export\u文件。

您可以按行应用。
iris.apply(foo,1)

其中
foo
是h2o能够理解的lambda(对于可以进入其中的内容有一些限制,但所有基本的数学运算都应该可以正常工作)


Cliff

除了Cliff所说的(这是更快的方法),您还可以将整个数据帧拉入Python空间,然后对其进行迭代

pd_frame = h2o_frame.as_data_frame(use_pandas=True)
如果你最终不想要熊猫:

np_array = h2o_frame.as_data_frame(use_pandas=True).as_matrix()
多了解一下你的图书馆可能有助于更好地回答这个问题