dplyr中的多组差异球门_R_Dplyr_Linear Regression

dplyr中的多组差异球门

dplyr中的多组差异球门,r,dplyr,linear-regression,R,Dplyr,Linear Regression,目前，我只报告我在下面显示的计算方法，但我想添加置信区间如果我有正确格式的数据，我就不必使用线性回归LM来计算估计的分组差异及其间隔，但我很难获得正确格式的数据以下是一些数据：假数据出身背景这是我经常做的三个计算 > # pre - post 2016 > pp16 <- 1498 - 899 > pp16 [1] 599 > > # pre - post 2017 > pp17 <-1100 - 999 > pp17 [1] 1

目前，我只报告我在下面显示的计算方法，但我想添加置信区间

如果我有正确格式的数据，我就不必使用线性回归LM来计算估计的分组差异及其间隔，但我很难获得正确格式的数据

以下是一些数据：

假数据出身背景这是我经常做的三个计算

> # pre - post 2016
> pp16 <- 1498 - 899
> pp16
[1] 599
> 
> # pre - post 2017
> pp17 <-1100 - 999
> pp17
[1] 101
> 
> # net of control: pp2016 - pp2017 
> noc <- pp16 - pp17
> noc
[1] 498

这个问题的答案是：

2016年或2017年前后的差异是什么

2017s前后差异是否大于2016s前后差异

我想回答这些问题，不仅要用估计，还要用置信区间。如上所述，我计划使用lm获得差异的置信区间，但我很难获得正确格式的数据

我认为这将需要两套数据集。一个用于年度期间差异，另一个用于控制净额差异。这导致了以下问题

问题如何计算按期间和年份分组的n的差异

如何计算差异的差异

首先，你可以通过使用另一组来获得差异

对于回归，您实际上不需要更改数据帧-需要数据来计算效果。我想，但不确定我是否理解正确，您正在寻找一个具有交互效果的模型

例如：

请注意，交互效果基本上就是这种差异

> # pre - post 2016
> pp16 <- 1498 - 899
> pp16
[1] 599
> 
> # pre - post 2017
> pp17 <-1100 - 999
> pp17
[1] 101
> 
> # net of control: pp2016 - pp2017 
> noc <- pp16 - pp17
> noc
[1] 498

diffs <- df %>% 
  group_by(year, period) %>% 
  summarise(mean = mean(n)) %>%
  group_by(year) %>%
  summarise(diff = diff(mean))

# A tibble: 2 x 2
   year  diff
  <dbl> <dbl>
1  2016   599
2  2017   105

diff(rev(diffs$diff))

[1] 493.8846

m1 <- lm(n ~ period + factor(year) + period*factor(year), data = df)
summary(m1)