Statistics stata回归中忽略的处理因子变量
我正在运行一个基本的差异回归模型,具有年和县固定效应,代码如下:Statistics stata回归中忽略的处理因子变量,statistics,regression,stata,linear-regression,Statistics,Regression,Stata,Linear Regression,我正在运行一个基本的差异回归模型,具有年和县固定效应,代码如下: xtreg ln_murder_rate i.treated##i.after_1980 i.year ln_deprivation ln_foreign_born young_population manufacturing low_skill_sector unemployment ln_median_income [weight = mean_population], fe cluster(fips) robust i.t
xtreg ln_murder_rate i.treated##i.after_1980 i.year ln_deprivation ln_foreign_born young_population manufacturing low_skill_sector unemployment ln_median_income [weight = mean_population], fe cluster(fips) robust
i.treated
是一种二分法,用于衡量一个县在研究期间是否接受了治疗,而在1980年之后
用于衡量治疗的后期。然而,当我运行这个回归时,我的治疗变量的估计被忽略了,所以我不能真正解释结果。下面是输出的屏幕截图。我希望能得到一些关于检查内容的指导,这样我就可以在治疗前得到治疗变量的估计值
xtreg ln_murder_rate i.treated##i.after_1980 i.year ln_deprivation ln_foreign_bo
> rn young_population manufacturing low_skill_sector unemployment ln_median_income
> [weight = mean_population], fe cluster(fips) robust
(analytic weights assumed)
note: 1.treated omitted because of collinearity
note: 2000.year omitted because of collinearity
Fixed-effects (within) regression Number of obs = 15,221
Group variable: fips Number of groups = 3,117
R-sq: Obs per group:
within = 0.2269 min = 1
between = 0.1093 avg = 4.9
overall = 0.0649 max = 5
F(12,3116) = 89.46
corr(u_i, Xb) = 0.0502 Prob > F = 0.0000
(Std. Err. adjusted for 3,117 clusters in fips)
---------------------------------------------------------------------------------
| Robust
ln_murder_rate | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------------+----------------------------------------------------------------
1.treated | 0 (omitted)
1.after_1980 | .2012816 .1105839 1.82 0.069 -.0155431 .4181063
|
treated#|
after_1980 |
1 1 | .0469658 .0857318 0.55 0.584 -.1211307 .2150622
|
year |
1970 | .4026329 .0610974 6.59 0.000 .2828376 .5224282
1980 | .6235034 .0839568 7.43 0.000 .4588872 .7881196
1990 | .4040176 .0525122 7.69 0.000 .3010555 .5069797
2000 | 0 (omitted)
|
ln_deprivation | .3500093 .119083 2.94 0.003 .1165202 .5834983
ln_foreign_born | .0179036 .0616842 0.29 0.772 -.1030421 .1388494
young_populat~n | .0030727 .0081619 0.38 0.707 -.0129306 .0190761
manufacturing | -.0242317 .0073166 -3.31 0.001 -.0385776 -.0098858
low_skill_sec~r | -.0084896 .0088702 -0.96 0.339 -.0258816 .0089025
unemployment | .0335105 .027627 1.21 0.225 -.0206585 .0876796
ln_median_inc~e | -.2423776 .1496396 -1.62 0.105 -.5357799 .0510246
_cons | 2.751071 1.53976 1.79 0.074 -.2679753 5.770118
----------------+----------------------------------------------------------------
sigma_u | .71424066
sigma_e | .62213091
rho | .56859936 (fraction of variance due to u_i)
---------------------------------------------------------------------------------
这是一个边缘话题,因为这本质上是一个统计问题 所处理的变量被删除,因为它是时不变的,并且您正在进行固定效应回归,该回归通过减去每个协变量和结果的每个面板的平均值来转换数据。处理过的观察值都设置为1,所以当你减去每个面板处理过的平均值时,也就是1,你得到一个零。同样,对于对照观察,除了它们都将处理设置为零。结果是,处理过的列都是零,Stata会删除它,因为否则矩阵是不可逆的,因为没有变化
您关心的参数在1980年之后处理,即DID效应,并在输出中报告。事实上,treated被删除并不重要。这是一个边缘话题,因为这本质上是一个统计问题 所处理的变量被删除,因为它是时不变的,并且您正在进行固定效应回归,该回归通过减去每个协变量和结果的每个面板的平均值来转换数据。处理过的观察值都设置为1,所以当你减去每个面板处理过的平均值时,也就是1,你得到一个零。同样,对于对照观察,除了它们都将处理设置为零。结果是,处理过的列都是零,Stata会删除它,因为否则矩阵是不可逆的,因为没有变化
您关心的参数在1980年之后处理,即DID效应,并在输出中报告。treated被删除的事实与此无关。我不使用stata,但它表示
1。treated由于共线性而被忽略
,因此我首先要检查1。treated
是否与您的任何其他预测值高度相关。我看不出编程问题。请务必向Statalist寻求了解输出的帮助。或者,这可能会找到一种缓慢的交叉验证方法。如前所述;从表面上看,两个变量说的是同一件事:如果是这样的话,那么一个被忽略是不可避免的。我不使用stata,但它说的是1。由于共线性而被忽略,所以我首先要检查1.treated
是否与任何其他预测值高度相关。我看不出编程问题。请务必向Statalist寻求了解输出的帮助。或者,这可能会找到一种缓慢的交叉验证方法。如前所述;从表面上看,两个变量说的是同一件事:如果是这样,那么不可避免地会忽略一个。@Andrewolff有帮助吗?@Andrewolff有帮助吗?