根据不同列(R)的值汇总数据
我有七个变量的数据,例如,一个月内每分钟DW_20。我想知道每天9/1/18、9/2/18等的每个变量的平均值。我试图使用dplyr Summary,但只收到返回的错误消息。我想这一定很容易,但我想不出来 原始数据前7行根据不同列(R)的值汇总数据,r,R,我有七个变量的数据,例如,一个月内每分钟DW_20。我想知道每天9/1/18、9/2/18等的每个变量的平均值。我试图使用dplyr Summary,但只收到返回的错误消息。我想这一定很容易,但我想不出来 原始数据前7行 Date DW_20 DW_24A DW_25A DW_26A DW_27A DW_28 DW_29 9/1/18 0:00 995.88 1110.62 1229.14 -0.09 4.50 1100.95 913.33 9/1/18 0:01 1
Date DW_20 DW_24A DW_25A DW_26A DW_27A DW_28 DW_29
9/1/18 0:00 995.88 1110.62 1229.14 -0.09 4.50 1100.95 913.33
9/1/18 0:01 1002.43 1115.85 1231.59 -0.09 4.50 1107.63 909.06
9/1/18 0:02 1007.01 1123.39 1236.75 -0.09 4.51 1108.37 935.00
9/1/18 0:03 1007.17 1121.69 1234.58 -0.09 4.52 1105.64 901.35
9/1/18 0:04 1005.27 1122.86 1233.25 -0.09 4.53 1107.56 911.15
9/1/18 0:05 1001.37 1116.39 1229.89 -0.09 4.54 1103.66 937.93
9/1/18 0:06 997.42 1112.40 1229.71 -0.09 4.55 1102.46 920.39
为测量日添加列的代码
#Load Data
data <- read.csv("Sep_2018_Well_Flows.csv", header=T)
#Create column of measurement day
data$Pump_Day <- format(as.Date(data$Date, format="%m/%d/%Y"), "%d")
y <- data$Pump_Day
data$Pump_Day <- as.factor(y)
如果要按每个“天”分组,则将“日期”转换为日期类,去除时间部分,并使用Summary_all获得平均值
欢迎来到堆栈溢出!感谢您分享原始数据的示例。您能分享一下dputthat_数据的输出吗?这样我们就可以看到所涉及的数据类型了?另外,你能告诉我你犯了什么错误吗?
library(dplyr)
data %>%
group_by(Day = as.Date(Date, "%m/%d/%y")) %>%
# or use `mdy` from `lubridate`
# group_by(Day = mdy(Date)) %>%
summarise_all(mean)