R 绘制子组比例之间的差异

R 绘制子组比例之间的差异,r,ggplot2,R,Ggplot2,我有一个随时间变化的数据框架(调查数据),其中两组(对照组为T,治疗组为T)的结果(0或1),如下所示: set.seed(3546) Data <- data.frame( date = sample((as.Date(as.Date("2011-12-30"):as.Date("2012-01-04"), origin="1970-01-01")), 1000, replace = T

我有一个随时间变化的数据框架(调查数据),其中两组(对照组为
T
,治疗组为
T
)的结果(
0
1
),如下所示:

set.seed(3546)
Data <- data.frame(
    date = sample((as.Date(as.Date("2011-12-30"):as.Date("2012-01-04"), 
                           origin="1970-01-01")),
                   1000, replace = TRUE),
    treatment_group = sample(c("C", "T"), 1000, replace = TRUE),
    outcome = sample(c("1", "0"), 1000, replace = TRUE)
    )
我得到了下面的图:

我想要的是一行显示每个时间点的值与相应置信区间之间的差异(用于比例差异的点估计),大致如下(显然样式将保持不变-只是为了给您一个想法)


该行应指明该特定日期结果
1
比例之间的差异。非常感谢您的帮助。:)

如果您在
prop
中没有任何不确定性度量,您希望如何计算CI

除此之外,您可以通过以下方式重塑日期,以绘制比例差异:

Data %>%
    mutate(
        treatment_group = factor(treatment_group, levels = c("T", "C")),
        date = as.POSIXct(date)) %>% #convert date to date
    group_by(treatment_group, date) %>% #group
    summarise(
        prop = sum(outcome == "1") / n()) %>% #calculate proportion
    spread(treatment_group, prop) %>%
    mutate(propdiff = T - C) %>%
    ggplot(aes(date, propdiff)) +
    geom_line() + 
    geom_point()


说明:在
总结
之后,我们将数据从长到宽进行转换,并将
propdiff
计算为
prop(T)-prop(C)

什么的置信区间?谢谢,我更新了问题;因为比例不同。
Data %>%
    mutate(
        treatment_group = factor(treatment_group, levels = c("T", "C")),
        date = as.POSIXct(date)) %>% #convert date to date
    group_by(treatment_group, date) %>% #group
    summarise(
        prop = sum(outcome == "1") / n()) %>% #calculate proportion
    spread(treatment_group, prop) %>%
    mutate(propdiff = T - C) %>%
    ggplot(aes(date, propdiff)) +
    geom_line() + 
    geom_point()