R 对环境使用tbl并相应地分配数据?

R 对环境使用tbl并相应地分配数据?,r,sparklyr,R,Sparklyr,我是spark新手,假设我在数据库中有如下“连接”: a <- data.frame(a = c(1:3), b = sample(letters, 3), c = rep(1)) b <- data.frame(as = c(1:3), b1 = sample(letters, 3), c2 = rep(2), d = c("KISS", "Scorpion", "Poison")) c <- data.frame(qn = c(10:20), rj = sample(LET

我是
spark
新手,假设我在数据库中有如下“连接”:

a <- data.frame(a = c(1:3), b = sample(letters, 3), c = rep(1))
b <- data.frame(as = c(1:3), b1 = sample(letters, 3), c2 = rep(2), d = c("KISS", "Scorpion", "Poison"))
c <- data.frame(qn = c(10:20), rj = sample(LETTERS, 11))
谢谢

你可以拿一张桌子(“a”,比如说)如下:

library(DBI)
a <- dbGetQuery(sc, paste("SELECT * FROM a"))

如果您真的、真的、真的想从列表中删除列表元素,您可以编写
attach(data\u list)
。这被认为是非常糟糕的编程,会使后续步骤变得相当复杂。

为什么要将数据集称为“连接”?你到底想用语言表达什么?这有点复杂(至少对我来说)。一般来说,我不熟悉Spark,但在我的Rstudio Rserver界面中有一个选项卡,用于销售“连接”(紧挨着环境和历史,这在Rstudio中是标准的)。我正在尝试将“连接”选项卡中的许多数据集移动到全局环境中。是否要将表从Spark移动到R或从R移动到R?我需要将数据集从Spark移动到Rserver
tbs <- src_tbls(sc)

data <- lapply(tbs, function(x) tbl(sc, x))
lapply(tbs, function(x) assign(x, tbl(sc,x)))
library(DBI)
a <- dbGetQuery(sc, paste("SELECT * FROM a"))
table_names <- src_tbls(sc)
data_list <- lapply(table_names,
             function(x) dbGetQuery(sc, paste("SELECT * FROM", x)))
names(data_list) <- table_names