在SparkR中使用h2o合并列（h2o.merge）_R_Merge_Sparkr_H2o

在SparkR中使用h2o合并列（h2o.merge）

r merge

在SparkR中使用h2o合并列（h2o.merge）,r,merge,sparkr,h2o,R,Merge,Sparkr,H2o,在我当前的项目中，我使用SparkR中的H2O机器学习库。我有多个.csv文件，并通过h2o数据帧读取这些.csv文件。现在，我想在文件上应用h2o.merge（）函数，将一个h2o数据帧的主键映射到另一个h2o数据帧的外键。我的主h2o数据框包含14列。我使用h2o.getTypes（）函数获取所有列的数据类型要应用h2o.merge（）函数，列的类型应为string或numeric，而不是enum或real。因此，为了转换列的数据类型，我使用了h2o.ascharacter（）和h2o.a

在我当前的项目中，我使用SparkR中的H2O机器学习库。我有多个.csv文件，并通过h2o数据帧读取这些.csv文件。现在，我想在文件上应用

h2o.merge（）

函数，将一个h2o数据帧的主键映射到另一个h2o数据帧的外键。我的主h2o数据框包含14列。我使用

h2o.getTypes（）

函数获取所有列的数据类型

要应用

h2o.merge（）

函数，列的类型应为string或numeric，而不是enum或real。因此，为了转换列的数据类型，我使用了

h2o.ascharacter（）

和

h2o.asfactor（）

函数。现在，我已经将枚举列转换为字符串列，以使用

h2o.merge（）

函数。当我使用

h2o.merge（）

函数时，它显示以下错误：我遗漏了什么吗？我已经从这个链接捕获了使用

h2o.merge（）

函数的语法。如何合并h2o数据帧？ factTable h2o数据框的样本数据集如下所示（销售组织是主键）：区域表h2o数据框的样本数据集如下所示（销售组织是外键）：

最后，我根据评论中的提示找出答案最基本的是，在应用合并操作之前，我们需要将列转换为factor/enum。具有主键或外键的列的数据类型应为factor/enum

能否提供一个可复制的示例（包括样本数据）？两个表的关键点是什么？我想你需要定义一下。executer如何在没有键值的两个表之间找到相似性？？？@sahildesai:键是在两个表之间定义的。我在合并操作中只映射关键列。我经常发现，在合并之前，我必须将字符串转换为因子，以使h2o.merge正常工作。我想知道你是否在这里遇到了类似的事情。@jmuhlenkamp-你能把这篇文章作为一个答案吗。隐藏逻辑is列应为枚举/因子格式，以便使用h2o执行合并操作。谢谢你的提示。