Linear regression 为什么置信区间与回归中的标准误差不一致？_Linear Regression_Stata_Standard Error

Linear regression 为什么置信区间与回归中的标准误差不一致？

stata

Linear regression 为什么置信区间与回归中的标准误差不一致？,linear-regression,stata,standard-error,Linear Regression,Stata,Standard Error,我正在运行一个线性回归，固定效应和标准误差由某一组聚集 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id) 单行代码如上所示，输出如下：现在，t-stats和p值看起来不一致。我们怎么能让t-stat>5而pval>11%？。同样，95%的置信区间似乎比系数要宽得多2标准错误我遗漏了什么？这里没有不一致的地方。你有一个小样本量和一个不太节俭的模型，几乎没有自由度。请注意，areg不会为模型发布F统计

我正在运行一个线性回归，固定效应和标准误差由某一组聚集

 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)

单行代码如上所示，输出如下：

现在，t-stats和p值看起来不一致。我们怎么能让t-stat>5而pval>11%？。同样，95%的置信区间似乎比系数要宽得多2标准错误

我遗漏了什么？

这里没有不一致的地方。你有一个小样本量和一个不太节俭的模型，几乎没有自由度。请注意，

areg

不会为模型发布F统计或P值，这是一个强烈的危险信号。您的t统计数据与手工检查一致：

. display 2 * ttail(1, 5.54)
.11368912

. display 2 * ttail(1, 113.1)
.00562868

简而言之，这里没有bug，也没有编程问题。这只是一个模型与数据拟合过度的问题，以及由此产生的副作用

类似地，95%置信区间的+/-2 SE在这里作为经验法则是远远不够的。同样，手工计算也很有指导意义：

. display invt(1, 0.975)
12.706205

. display invt(60, 0.975)
2.0002978

. display invt(61, 0.975)
1.9996236

. display invnormal(0.975)
1.959964

谢谢。那么，当只有两个组时，产生集群标准错误有意义吗？这些团体是国家。第一个国家有50个观测值，第二个国家有30个观测值。问题是你估计了多少个参数。而不是使用集群SEs。