提取dplyr tbl列作为向量_R_Dplyr_Lazy Evaluation_Collect

提取dplyr tbl列作为向量

提取dplyr tbl列作为向量,r,dplyr,lazy-evaluation,collect,R,Dplyr,Lazy Evaluation,Collect,是否有更简洁的方法从带有数据库后端的tbl中获取dplyr tbl的一列作为向量（即数据帧/表不能直接作为子集）但这似乎有点笨拙。我可能会写： collect(select(iris2, Species))[[1]] 由于dplyr是为处理TBL数据而设计的，因此没有更好的方法来获取单个数据列。我可能会这样写： collect(select(iris2, Species))[[1]] 由于dplyr是为处理TBL数据而设计的，因此没有更好的方法来获取一列数据。根据@nacnudus的评论，

是否有更简洁的方法从带有数据库后端的tbl中获取dplyr tbl的一列作为向量（即数据帧/表不能直接作为子集）

但这似乎有点笨拙。

我可能会写：

collect(select(iris2, Species))[[1]]

由于dplyr是为处理TBL数据而设计的，因此没有更好的方法来获取单个数据列。

我可能会这样写：

collect(select(iris2, Species))[[1]]

由于dplyr是为处理TBL数据而设计的，因此没有更好的方法来获取一列数据。

根据@nacnudus的评论，dplyr 0.6中似乎实现了一个

拉功能：
iris2 %>% pull(Species)


对于较旧版本的dplyr，这里有一个简洁的函数，可以让拉出一列变得更好（更容易键入，也更容易阅读）：
导致
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4

它还可以很好地处理数据帧：
> mtcars %>% pull(5)
 [1] 3.90 3.90 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 3.92 3.07 3.07 3.07 2.93 3.00 3.23 4.08 4.93 4.22 3.70 2.76 3.15 3.73 3.08 4.08 4.43
[28] 3.77 4.22 3.62 3.54 4.11


在dplyr
的v0.2中有一个很好的方法可以做到这一点：
iris2 %>% select(Species) %>% collect %>% .[[5]]

或者，如果您愿意：
iris2 %>% select(Species) %>% collect %>% .[["Species"]]

或者如果你的桌子不是太大，简单地说
iris2 %>% collect %>% .[["Species"]]

根据@nacnudus的评论，它看起来像是在dplyr 0.6中实现了一个pull
函数：
iris2 %>% pull(Species)


对于较旧版本的dplyr，这里有一个简洁的函数，可以让拉出一列变得更好（更容易键入，也更容易阅读）：
导致
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4

它还可以很好地处理数据帧：
> mtcars %>% pull(5)
 [1] 3.90 3.90 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 3.92 3.07 3.07 3.07 2.93 3.00 3.23 4.08 4.93 4.22 3.70 2.76 3.15 3.73 3.08 4.08 4.43
[28] 3.77 4.22 3.62 3.54 4.11


在dplyr
的v0.2中有一个很好的方法可以做到这一点：
iris2 %>% select(Species) %>% collect %>% .[[5]]

或者，如果您愿意：
iris2 %>% select(Species) %>% collect %>% .[["Species"]]

或者如果你的桌子不是太大，简单地说
iris2 %>% collect %>% .[["Species"]]

我将使用magrittr
中的extract2
便利功能：
library(magrittr)
library(dplyr)

iris2 %>%
  select(Species) %>%
  extract2(1)  

我将使用magrittr
中的extract2
便利功能：
library(magrittr)
library(dplyr)

iris2 %>%
  select(Species) %>%
  extract2(1)  

您还可以使用unlist
，我觉得这更容易阅读，因为您不需要重复列名或指定索引
iris2 %>% select(Species) %>% unlist(use.names = FALSE)

您还可以使用unlist
，我觉得这更容易阅读，因为您不需要重复列名或指定索引
iris2 %>% select(Species) %>% unlist(use.names = FALSE)

@Luke1018在其中一条评论中提出了该解决方案：
您还可以使用magrittr
exposition操作符（%%$%
）从数据帧中提取向量
例如：
iris2 %>% select(Species) %>% collect() %$% Species

我认为它应该有自己的答案。
@Luke1018在其中一条评论中提出了这个解决方案：
您还可以使用magrittr
exposition操作符（%%$%
）从数据帧中提取向量
例如：
iris2 %>% select(Species) %>% collect() %$% Species

我认为它应该有自己的答案。
如果dplyr>=0.7.0，您可以使用pull
从tbl
获取向量


库（“dplyr”）
#> 
#>正在附加包：“dplyr”
#>以下对象已从“package:stats”屏蔽：
#> 
#>滤波器，滞后
#>以下对象已从“package:base”屏蔽：
#> 
#>相交、setdiff、setequal、并集
db当dplyr>=0.7.0时，可以使用pull
从tbl
获取向量


库（“dplyr”）
#> 
#>正在附加包：“dplyr”
#>以下对象已从“package:stats”屏蔽：
#> 
#>滤波器，滞后
#>以下对象已从“package:base”屏蔽：
#> 
#>相交、setdiff、setequal、并集
db如果您习惯于使用方括号进行索引，另一种选择是只在调用中使用常用的索引方法，例如：
库（tidyverse）
iris2如果您习惯于使用方括号进行索引，另一种选择是只在调用中使用常用的索引方法，例如：
库（tidyverse）
iris2说的再公平不过了。当我尝试使用unique（table$column）检查虚假值时，它在控制台中以交互方式出现。@nacnudus对于这种情况，您也可以执行group_by（column）%。%tally（）
一个参数drop=TRUE
到dplyr:：select
对于我们实际需要提取向量的许多用例来说将是惊人的。这是我从sdf中获取列的唯一方法。Pull在版本0.7.8上对我不起作用。不能说比这更公平。当我尝试使用unique（table$column）检查虚假值时，它在控制台中以交互方式出现。@nacnudus对于这种情况，您也可以执行group_by（column）%。%tally（）
一个参数drop=TRUE
到dplyr:：select
对于我们实际需要提取向量的许多用例来说将是惊人的。这是我从sdf中获取列的唯一方法。Pull在0.7.8版上对我不起作用。你是不是想在select
和extract2
之间使用collect（）
？use\u系列（物种）
可能更具可读性。感谢您提醒我注意这些函数，还有其他几个方便的函数。您是否打算在select
和extract2
之间使用collect（）。谢谢你提醒我这些函数，还有其他几个方便的函数，我喜欢你的pull函数。我只想为只有一个变量的情况添加一个简化：pull您还可以使用magrittr
exposition操作符（%%$%
）从数据帧中提取向量。i、 e.iris2%>%select（Species）%%>%collect（）%%$%Species
@Luke1018您应该根据此评论创建答案pull（）
将在dplyr版本0.6中实现。我喜欢您的pull函数。我只想为只有一个变量的情况添加一个简化：pull您还可以使用magrittr
exposition操作符（%%$%
）从数据帧中提取向量。i、 e.iris2%>%select（Species）%%>%collect（）%%$%Species
@Luke1018您应该从这条评论中创建一个答案pull（）
将在dplyr版本0.6中实现这似乎是最通用的方法，因为它与向量和data.frames相同，即它使函数更不可知。我是JU