R 按因子计算的累积数据随时间的变化
我使用的是俄勒冈州的竞选捐款数据,我试图制作一个图表,显示每个候选人在一段时间内的累计捐款额。以下是我目前掌握的情况:R 按因子计算的累积数据随时间的变化,r,graph,ggplot2,cumsum,R,Graph,Ggplot2,Cumsum,我使用的是俄勒冈州的竞选捐款数据,我试图制作一个图表,显示每个候选人在一段时间内的累计捐款额。以下是我目前掌握的情况: ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"), y = cumsum(contb_receipt_amt)), data = subset(oregon_data, table(oregon_data$cand_nm)[orego
ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"),
y = cumsum(contb_receipt_amt)),
data = subset(oregon_data,
table(oregon_data$cand_nm)[oregon_data$cand_nm] > 1000
& as.Date(contb_receipt_dt, "%d-%b-%y") > as.Date("2015-01-01")))
+ geom_line(aes(color = cand_nm), bins = 5)
这就是它看起来的样子:
我想看到的是,每个候选人都有一行,从0开始,然后随着每一个额外贡献慢慢上升。我该怎么办?在发送到ggplot之前,我会使用dplyr计算
cumsum
列。这应该足以让您获得sarted,但您需要对其进行整理并过滤数据,以获得所需的结果:
WashingtonData <- read.csv("P00000001-WA.csv")
WashingtonData <- WashingtonData %>% arrange(contb_receipt_dt)
MyGraphData <- WashingtonData %>% group_by(cand_nm) %>% mutate(cumsum = cumsum(contb_receipt_amt))
g <- ggplot(data=MyGraphData, aes(y=cumsum, x=contb_receipt_dt, color=cand_nm)) + geom_line()
g
WashingtonData%变异(累计金额=累计金额(续收款金额))
这个数据是开放数据吗?你有URL吗?或者你可以发布一个小样本吗?我正在使用俄勒冈州的数据: