Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/69.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用sparkR在不同的集群上进行并行计算?_R_Sparkr - Fatal编程技术网

如何使用sparkR在不同的集群上进行并行计算?

如何使用sparkR在不同的集群上进行并行计算?,r,sparkr,R,Sparkr,我在本地运行了一个R脚本:每个记录/行都被送入一个名为func的函数来执行一些计算。因此,流程如下所示 new <- lapply(old, func) 正在开发新的并行函数,类似于SparkR上的doParallel,但在1.6.0中尚未提供 另一种选择可能是在SparkR中使用UDF,目前也在开发中,尚未提供 基本上,问题是“SparkR中是否有类似于doparallel但在多个工人身上运行的支持”是否要绘制地图?如果是这样,请参阅感谢您的回复。感到惊讶的是,sparkR到目前为

我在本地运行了一个R脚本:每个记录/行都被送入一个名为func的函数来执行一些计算。因此,流程如下所示

 new <- lapply(old, func)

正在开发新的并行函数,类似于SparkR上的doParallel,但在1.6.0中尚未提供

另一种选择可能是在SparkR中使用UDF,目前也在开发中,尚未提供


基本上,问题是“SparkR中是否有类似于doparallel但在多个工人身上运行的支持”是否要绘制地图?如果是这样,请参阅感谢您的回复。感到惊讶的是,sparkR到目前为止还没有这个。期待新版本的发布。但是,我会把这篇文章保留一段时间,以防有人碰巧知道解决问题的其他方法。谢谢:)查收。amplab extras中的原始sparkR似乎可以支持分布式RDD。@HappyCodeing的问题不是支持本身,而是如何支持性能和健壮性。这就是为什么自正式发布以来,SparkR中没有包含RDDAPI的原因。