R 按因子计算的累积数据随时间的变化

R 按因子计算的累积数据随时间的变化,r,graph,ggplot2,cumsum,R,Graph,Ggplot2,Cumsum,我使用的是俄勒冈州的竞选捐款数据,我试图制作一个图表,显示每个候选人在一段时间内的累计捐款额。以下是我目前掌握的情况: ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"), y = cumsum(contb_receipt_amt)), data = subset(oregon_data, table(oregon_data$cand_nm)[orego

我使用的是俄勒冈州的竞选捐款数据,我试图制作一个图表,显示每个候选人在一段时间内的累计捐款额。以下是我目前掌握的情况:

ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"), 
           y = cumsum(contb_receipt_amt)),
           data = subset(oregon_data,
                      table(oregon_data$cand_nm)[oregon_data$cand_nm] > 1000                         
                          & as.Date(contb_receipt_dt, "%d-%b-%y") > as.Date("2015-01-01"))) 
+ geom_line(aes(color = cand_nm), bins = 5)
这就是它看起来的样子:


我想看到的是,每个候选人都有一行,从0开始,然后随着每一个额外贡献慢慢上升。我该怎么办?

在发送到ggplot之前,我会使用dplyr计算
cumsum
列。这应该足以让您获得sarted,但您需要对其进行整理并过滤数据,以获得所需的结果:

WashingtonData <- read.csv("P00000001-WA.csv")
WashingtonData <- WashingtonData %>% arrange(contb_receipt_dt)

MyGraphData <- WashingtonData %>% group_by(cand_nm) %>% mutate(cumsum = cumsum(contb_receipt_amt))

g <- ggplot(data=MyGraphData, aes(y=cumsum, x=contb_receipt_dt, color=cand_nm)) + geom_line()
g
WashingtonData%变异(累计金额=累计金额(续收款金额))

这个数据是开放数据吗?你有URL吗?或者你可以发布一个小样本吗?我正在使用俄勒冈州的数据: