R 在hadoop计算上下文中合并两个xdf文件
我有两个RxXdfData数据源,我想在RxHadoopMR计算上下文中的某个列上合并它们 我的两个xdf数据源都很大,都存在于hdfs上。我们如何合并它们 我尝试了RxDataStep追加选项,但revolution r抱怨说,它无法接受复合xdf文件,并建议我改用rxExec 我知道这可以在本地计算上下文中使用rxMerge函数来完成,但我必须执行以下步骤:R 在hadoop计算上下文中合并两个xdf文件,r,revolution-r,R,Revolution R,我有两个RxXdfData数据源,我想在RxHadoopMR计算上下文中的某个列上合并它们 我的两个xdf数据源都很大,都存在于hdfs上。我们如何合并它们 我尝试了RxDataStep追加选项,但revolution r抱怨说,它无法接受复合xdf文件,并建议我改用rxExec 我知道这可以在本地计算上下文中使用rxMerge函数来完成,但我必须执行以下步骤: 将数据复制到边缘节点(本地上下文) 生成.xdf文件 使用rxMerge合并.xdf文件 将输出.xdf文件转换为txt/csv格式