Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/76.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 合并多个表时出现堆栈溢出错误_R_Sparklyr - Fatal编程技术网

R 合并多个表时出现堆栈溢出错误

R 合并多个表时出现堆栈溢出错误,r,sparklyr,R,Sparklyr,我有一个用例,我想将许多表拉入spark(因为它们是单独的Cassandra分区),并将它们合并在一起,这样我就可以使用dplyr和groupby处理生成的大表 我不能完全独立地处理所有的表,比如说,我的独立表是 (a1), (a2), (a3), (a4), (b1), (b2), (b3), (b4) 我需要向表提交一个查询 ((a1, a2, a3, a4), (b1, b2, b3, b4)) 因此,我至少需要做一些分组。从概念上讲,按照上面的“字母”将所有内容合并并分组要容易得多

我有一个用例,我想将许多表拉入spark(因为它们是单独的Cassandra分区),并将它们合并在一起,这样我就可以使用
dplyr
groupby
处理生成的大表

我不能完全独立地处理所有的表,比如说,我的独立表是

(a1), (a2), (a3), (a4), (b1), (b2), (b3), (b4)
我需要向表提交一个查询

((a1, a2, a3, a4), (b1, b2, b3, b4))
因此,我至少需要做一些分组。从概念上讲,按照上面的“字母”将所有内容合并并分组要容易得多

我正在使用的产生堆栈溢出错误的代码的MWE如下所示:

# Removing this option results in an evaluation nested too deeply error
options( expressions = 5e5 )

library(sparklyr)
library(dplyr)
sc <- spark_connect(master = "local", spark_home = spark_home_dir())

n = 500

l = as.list(1:n)

for (i in 1:n) {
  l[[i]] <- copy_to(
    dest = sc, 
    iris, 
    name = paste0("iris", i), 
    overwrite = TRUE, 
    cache = TRUE)
}

dt = l %>% purrr::reduce(dplyr::union_all)
dt
#删除此选项会导致计算嵌套太深的错误
选项(表达式=5e5)
图书馆(年)
图书馆(dplyr)

sc这是通过
SparkyR
错误报告解决的

这是通过
SparkyR
错误报告解决的