用最小二乘虚拟变量法在R
我试图做一个固定效应的差异回归。回归分析的目的是评估参加电视转播的体育赛事与其他未参加比赛的球队相比,对参赛球队社交媒体粉丝数量的影响 我的数据如下所示: [资料][1] 因变量是Rate_Percent,这是Facebook喜欢的增长率,计算如下用最小二乘虚拟变量法在R,r,linear-regression,panel-data,R,Linear Regression,Panel Data,我试图做一个固定效应的差异回归。回归分析的目的是评估参加电视转播的体育赛事与其他未参加比赛的球队相比,对参赛球队社交媒体粉丝数量的影响 我的数据如下所示: [资料][1] 因变量是Rate_Percent,这是Facebook喜欢的增长率,计算如下 Dataset_FB <- Dataset_FB %>% group_by(ID) %>% mutate(Diff_Growth = FBLikes - lag(FBLikes), Rate_Percent
Dataset_FB <- Dataset_FB %>% group_by(ID) %>%
mutate(Diff_Growth = FBLikes - lag(FBLikes),
Rate_Percent = Diff_Growth / lag(FBLikes) * 100)
Dataset\u FB%group\u by(ID)%>%
突变(差异生长=类FBLikes-滞后(类FBLikes),
比率百分比=差异增长/滞后(FBI)*100)
Teilnahme是一个虚拟变量,用于区分参与者和非参与者,Hauptrunde是一个虚拟变量,用于指示治疗的时间范围(治疗前为0,治疗后为1)。我试图将ID、Uhrzeit和Spieltag作为固定效果,以控制俱乐部和时间差异
我的回归如下所示:
lm(formula = Rate_Percent ~ Teilnahme + Hauptrunde + Teilnahme *
Hauptrunde + factor(ID) + factor(Uhrzeit) + factor(Spieltag),
data = Dataset_FB)
Residuals:
Min 1Q Median 3Q Max
-0.2834 -0.0343 -0.0111 0.0092 4.9302
Coefficients: (6 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.0266970 0.0125098 2.134 0.03288 *
Teilnahme 0.0020571 0.1662742 0.012 0.99013
Hauptrunde -0.0158433 0.0060631 -2.613 0.00900 **
factor(ID)8 -0.0344717 0.0171467 -2.010 0.04443 *
factor(ID)25 -0.0155100 0.1662745 -0.093 0.92568
factor(ID)56 0.0122209 0.0171467 0.713 0.47604
factor(ID)69 -0.0093248 0.1662745 -0.056 0.95528
factor(ID)90 -0.0037743 0.0171467 -0.220 0.82578
factor(ID)93 0.0948638 0.0171467 5.532 3.29e-08 ***
factor(ID)103 0.0117689 0.0171467 0.686 0.49251
factor(ID)115 0.0479442 0.0171467 2.796 0.00519 **
factor(ID)166 -0.0129542 0.0171467 -0.755 0.44998
factor(ID)364 -0.0112018 0.0171467 -0.653 0.51359
factor(ID)373 -0.0111296 0.0171467 -0.649 0.51631
factor(ID)490 -0.0231408 0.0171467 -1.350 0.17720
factor(ID)752 -0.0064241 0.0171467 -0.375 0.70793
factor(ID)907 0.1333400 0.0171467 7.776 8.75e-15 ***
factor(ID)951 0.0087327 0.0171467 0.509 0.61057
factor(ID)996 -0.0105943 0.0171467 -0.618 0.53669
factor(ID)1238 0.0076285 0.0171467 0.445 0.65641
factor(ID)1315 0.0304732 0.1662745 0.183 0.85459
factor(ID)1316 0.1290605 0.0171467 7.527 5.98e-14 ***
factor(ID)1400 0.0038137 0.0171467 0.222 0.82400
factor(ID)1401 -0.0135700 0.0171467 -0.791 0.42874
factor(ID)1712 -0.0001285 0.0171467 -0.007 0.99402
factor(ID)3417 0.0053766 0.0171467 0.314 0.75386
factor(ID)5646 0.0052521 0.0171467 0.306 0.75939
factor(ID)6273 -0.0134096 0.0171467 -0.782 0.43422
factor(ID)7679 -0.0104365 0.0171467 -0.609 0.54277
factor(ID)9029 NA NA NA NA
factor(ID)10213 -0.0441121 0.0171467 -2.573 0.01012 *
factor(ID)26957 -0.0287541 0.0171700 -1.675 0.09405 .
factor(ID)29988 0.1015109 0.1662745 0.611 0.54155
factor(ID)40373 0.0203831 0.0171467 1.189 0.23459
factor(Uhrzeit)1530 0.0206731 0.1653880 0.125 0.90053
factor(Uhrzeit)1830 NA NA NA NA
factor(Uhrzeit)2045 NA NA NA NA
factor(Spieltag)NA NA NA NA NA
factor(Spieltag)Sa NA NA NA NA
factor(Spieltag)So NA NA NA NA
Teilnahme:Hauptrunde 0.0053874 0.0085752 0.628 0.52987
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1649 on 5885 degrees of freedom
(32 observations deleted due to missingness)
Multiple R-squared: 0.07278, Adjusted R-squared: 0.06742
F-statistic: 13.59 on 34 and 5885 DF, p-value: < 2.2e-16
[1]: https://i.stack.imgur.com/ZBAqL.png
注册
ID
、Uhrzeit
和Spieltag
中有观测值,其中只有一个唯一观测值,因此模型无法估计这些观测值的系数
data <- pdata.frame(data, index=c("ID", "Uhrzeit"))
plm(formula = Rate_Percent ~ Teilnahme + Hauptrunde + Teilnahme *
Hauptrunde + factor(Spieltag), data=Dataset_FB, model = "within", effect = "twoways", index = c("ID","Uhrzeit"))
作为一种解释:这些固定效果包的工作方式是,它们首先转换数据(使用内部转换),基本上去掉组的平均值。由于这一点,我们实际上不需要像在代码中那样估计固定效果的系数。因此,这些其他解决方案稍微更简洁,并且产生更易于阅读的输出,但从数字上看,应该没有任何区别
est <- felm(Rate_Percent ~ Teilnahme + Hauptrunde + Teilnahme *
Hauptrunde | ID + Uhrzeit + Spieltag, data = Dataset_FB)