计算每个观测值的加权平均值（Stata）_Stata

计算每个观测值的加权平均值（Stata）

stata

计算每个观测值的加权平均值（Stata）,stata,Stata,我有以下两个变量，我试图用每个观察值的个体权重来计算失业率。下面的第一个变量显示给每个受访者的权重，而第二个变量显示该人是否失业，其中1表示该人失业，如果他们正在工作，则为0。最后，LF_status以字符串格式表示劳动力状态 dataex (ind_wt unemp_status) LF_status .42645285 0 emp .11840937 1 unemp .11849173

我有以下两个变量，我试图用每个观察值的个体权重来计算失业率。下面的第一个变量显示给每个受访者的权重，而第二个变量显示该人是否失业，其中1表示该人失业，如果他们正在工作，则为0。最后，LF_status以字符串格式表示劳动力状态

dataex (ind_wt   unemp_status)   LF_status
.42645285         0                emp
 .11840937        1                unemp
 .11849173        0                emp
   1.49918        1                unemp

我接受了赛博耐克的帖子，新创建的加权失业变量的值在所有观察结果中如下所示，这有意义吗

egen unemployment_weighted= wtmean(unemp_status), weight(ind_wt)
dataex unemployment_weighted
.3786077
.3786077
.3786077
.3786077

您可以使用SSC提供的

\u GWTMEAN

包来完成此操作。可能还有其他方法

ssc install _gwtmean

egen wanted = wtmean(unemp_status), weight(ind_wt)

. list

     +--------------------------------+
     |   ind_wt   unemp_~s     wanted |
     |--------------------------------|
  1. | .4264528          0   .5549336 |
  2. | .1184094          .   .5549336 |
  3. | .1184917          0   .5549336 |
  4. |  1.49918          0   .5549336 |
  5. | .7357956          .   .5549336 |
     |--------------------------------|
  6. | .8300208          0   .5549336 |
  7. | 4.741648          0   .5549336 |
  8. | 9.495796          1   .5549336 |
     +--------------------------------+

您可以使用SSC提供的

\u GWTMEAN

包来完成此操作。可能还有其他方法

ssc install _gwtmean

egen wanted = wtmean(unemp_status), weight(ind_wt)

. list

     +--------------------------------+
     |   ind_wt   unemp_~s     wanted |
     |--------------------------------|
  1. | .4264528          0   .5549336 |
  2. | .1184094          .   .5549336 |
  3. | .1184917          0   .5549336 |
  4. |  1.49918          0   .5549336 |
  5. | .7357956          .   .5549336 |
     |--------------------------------|
  6. | .8300208          0   .5549336 |
  7. | 4.741648          0   .5549336 |
  8. | 9.495796          1   .5549336 |
     +--------------------------------+

如果你用权重计算一个平均值，

summary

就可以了。代码运行良好，但我如何使用新创建的变量计算按性别或教育程度加权的失业率？这行得通吗：

bysort性别：汇总失业率

？此处引用的代码

wtmean（）

没有帮助文件，只需查看代码即可查看是否支持

by（）

选项。在任何情况下，任何加权平均值的形式为总和（重量*值）/总和（重量），因此可以通过应用

egen

的

total（）

函数或其他方法在几行中进行计算。一般来说，如果你想在变量中得到结果，

总结

充其量只是第一步；通常可以使用一次完成此操作的命令，例如

egen

。谢谢，解释清楚！如果你用权重计算一个平均值，

summary