Linear regression 为什么置信区间与回归中的标准误差不一致?

Linear regression 为什么置信区间与回归中的标准误差不一致?,linear-regression,stata,standard-error,Linear Regression,Stata,Standard Error,我正在运行一个线性回归,固定效应和标准误差由某一组聚集 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id) 单行代码如上所示,输出如下: 现在,t-stats和p值看起来不一致。我们怎么能让t-stat>5而pval>11%?。同样,95%的置信区间似乎比系数要宽得多2标准错误 我遗漏了什么?这里没有不一致的地方。你有一个小样本量和一个不太节俭的模型,几乎没有自由度。请注意,areg不会为模型发布F统计

我正在运行一个线性回归,固定效应和标准误差由某一组聚集

 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)
单行代码如上所示,输出如下:

现在,t-stats和p值看起来不一致。我们怎么能让t-stat>5而pval>11%?。同样,95%的置信区间似乎比系数要宽得多2标准错误


我遗漏了什么?

这里没有不一致的地方。你有一个小样本量和一个不太节俭的模型,几乎没有自由度。请注意,
areg
不会为模型发布F统计或P值,这是一个强烈的危险信号。您的t统计数据与手工检查一致:

. display 2 * ttail(1, 5.54)
.11368912

. display 2 * ttail(1, 113.1)
.00562868
简而言之,这里没有bug,也没有编程问题。这只是一个模型与数据拟合过度的问题,以及由此产生的副作用

类似地,95%置信区间的+/-2 SE在这里作为经验法则是远远不够的。同样,手工计算也很有指导意义:

. display invt(1, 0.975)
12.706205

. display invt(60, 0.975)
2.0002978

. display invt(61, 0.975)
1.9996236

. display invnormal(0.975)
1.959964

谢谢。那么,当只有两个组时,产生集群标准错误有意义吗?这些团体是国家。第一个国家有50个观测值,第二个国家有30个观测值。问题是你估计了多少个参数。而不是使用集群SEs。