使用multidplyr时如何按多个列拆分
tl;dr使用multidplyr时如何按多个列拆分,r,dplyr,multidplyr,R,Dplyr,Multidplyr,tl;dr 如何从多个列上的multipyr拆分中生成“分区” 动机: 我不喜欢使用32个内核中的1个来进行艰苦的总结,所以我尝试使用我正在操作多个列 示例: vignette显示通过单个列进行分组,但当我这样做时,我的另一个分组列将不被考虑 代码: library(dplyr) library(multidplyr) library(nycflights13) flights1 <- partition(flights, flight) flights2 <- summarise
如何从多个列上的multipyr拆分中生成“分区” 动机:
我不喜欢使用32个内核中的1个来进行艰苦的总结,所以我尝试使用我正在操作多个列 示例:
vignette显示通过单个列进行分组,但当我这样做时,我的另一个分组列将不被考虑 代码:
library(dplyr)
library(multidplyr)
library(nycflights13)
flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)
库(dplyr)
库(多DPLYR)
图书馆(nycflights13)
飞行1根据?分区
,分区
的用法是
partition(.data,…,cluster=get\u default\u cluster())
其中,…
是要划分的变量。不要传入变量列表,而是分别传入每个变量,即
partition(flights, year, month, day)
我想你应该在git-hub上打开一个问题。分区(航班、年、月、日)
对你有用吗?它可能。。。我正在等待处理,以继续查看我的专栏在“收集”上的内容。@WeihuangWong-它似乎正在工作。非常感谢。你能把它变成一个答案吗?
partition(flights, year, month, day)