在SparkR中使用h2o合并列(h2o.merge)

在SparkR中使用h2o合并列(h2o.merge),r,merge,sparkr,h2o,R,Merge,Sparkr,H2o,在我当前的项目中,我使用SparkR中的H2O机器学习库。我有多个.csv文件,并通过h2o数据帧读取这些.csv文件。现在,我想在文件上应用h2o.merge()函数,将一个h2o数据帧的主键映射到另一个h2o数据帧的外键。我的主h2o数据框包含14列。我使用h2o.getTypes()函数获取所有列的数据类型 要应用h2o.merge()函数,列的类型应为string或numeric,而不是enum或real。因此,为了转换列的数据类型,我使用了h2o.ascharacter()和h2o.a

在我当前的项目中,我使用SparkR中的H2O机器学习库。我有多个.csv文件,并通过h2o数据帧读取这些.csv文件。现在,我想在文件上应用
h2o.merge()
函数,将一个h2o数据帧的主键映射到另一个h2o数据帧的外键。我的主h2o数据框包含14列。我使用
h2o.getTypes()
函数获取所有列的数据类型

要应用
h2o.merge()
函数,列的类型应为string或numeric,而不是enum或real。因此,为了转换列的数据类型,我使用了
h2o.ascharacter()
h2o.asfactor()
函数。现在,我已经将枚举列转换为字符串列,以使用
h2o.merge()
函数。当我使用
h2o.merge()
函数时,它显示以下错误: 我遗漏了什么吗?我已经从这个链接捕获了使用
h2o.merge()
函数的语法。 如何合并h2o数据帧? factTable h2o数据框的样本数据集如下所示(销售组织是主键): 区域表h2o数据框的样本数据集如下所示(销售组织是外键):

最后,我根据评论中的提示找出答案最基本的是,在应用合并操作之前,我们需要将列转换为factor/enum。具有主键或外键的列的数据类型应为factor/enum

能否提供一个可复制的示例(包括样本数据)?两个表的关键点是什么?我想你需要定义一下。executer如何在没有键值的两个表之间找到相似性???@sahildesai:键是在两个表之间定义的。我在合并操作中只映射关键列。我经常发现,在合并之前,我必须将字符串转换为因子,以使h2o.merge正常工作。我想知道你是否在这里遇到了类似的事情。@jmuhlenkamp-你能把这篇文章作为一个答案吗。隐藏逻辑is列应为枚举/因子格式,以便使用h2o执行合并操作。谢谢你的提示。