计算每个观测值的加权平均值(Stata)

计算每个观测值的加权平均值(Stata),stata,Stata,我有以下两个变量,我试图用每个观察值的个体权重来计算失业率。下面的第一个变量显示给每个受访者的权重,而第二个变量显示该人是否失业,其中1表示该人失业,如果他们正在工作,则为0。最后,LF_status以字符串格式表示劳动力状态 dataex (ind_wt unemp_status) LF_status .42645285 0 emp .11840937 1 unemp .11849173

我有以下两个变量,我试图用每个观察值的个体权重来计算失业率。下面的第一个变量显示给每个受访者的权重,而第二个变量显示该人是否失业,其中1表示该人失业,如果他们正在工作,则为0。最后,LF_status以字符串格式表示劳动力状态

dataex (ind_wt   unemp_status)   LF_status
.42645285         0                emp
 .11840937        1                unemp
 .11849173        0                emp
   1.49918        1                unemp
我接受了赛博耐克的帖子,新创建的加权失业变量的值在所有观察结果中如下所示,这有意义吗

egen unemployment_weighted= wtmean(unemp_status), weight(ind_wt)
dataex unemployment_weighted
.3786077
.3786077
.3786077
.3786077

您可以使用SSC提供的
\u GWTMEAN
包来完成此操作。可能还有其他方法

ssc install _gwtmean

egen wanted = wtmean(unemp_status), weight(ind_wt)

. list

     +--------------------------------+
     |   ind_wt   unemp_~s     wanted |
     |--------------------------------|
  1. | .4264528          0   .5549336 |
  2. | .1184094          .   .5549336 |
  3. | .1184917          0   .5549336 |
  4. |  1.49918          0   .5549336 |
  5. | .7357956          .   .5549336 |
     |--------------------------------|
  6. | .8300208          0   .5549336 |
  7. | 4.741648          0   .5549336 |
  8. | 9.495796          1   .5549336 |
     +--------------------------------+

您可以使用SSC提供的
\u GWTMEAN
包来完成此操作。可能还有其他方法

ssc install _gwtmean

egen wanted = wtmean(unemp_status), weight(ind_wt)

. list

     +--------------------------------+
     |   ind_wt   unemp_~s     wanted |
     |--------------------------------|
  1. | .4264528          0   .5549336 |
  2. | .1184094          .   .5549336 |
  3. | .1184917          0   .5549336 |
  4. |  1.49918          0   .5549336 |
  5. | .7357956          .   .5549336 |
     |--------------------------------|
  6. | .8300208          0   .5549336 |
  7. | 4.741648          0   .5549336 |
  8. | 9.495796          1   .5549336 |
     +--------------------------------+

如果你用权重计算一个平均值,
summary
就可以了。代码运行良好,但我如何使用新创建的变量计算按性别或教育程度加权的失业率?这行得通吗:
bysort性别:汇总失业率
?此处引用的代码
wtmean()
没有帮助文件,只需查看代码即可查看是否支持
by()
选项。在任何情况下,任何加权平均值的形式为总和(重量*值)/总和(重量),因此可以通过应用
egen
total()
函数或其他方法在几行中进行计算。一般来说,如果你想在变量中得到结果,
总结
充其量只是第一步;通常可以使用一次完成此操作的命令,例如
egen
。谢谢,解释清楚!如果你用权重计算一个平均值,
summary
就可以了。代码运行良好,但我如何使用新创建的变量计算按性别或教育程度加权的失业率?这行得通吗:
bysort性别:汇总失业率
?此处引用的代码
wtmean()
没有帮助文件,只需查看代码即可查看是否支持
by()
选项。在任何情况下,任何加权平均值的形式为总和(重量*值)/总和(重量),因此可以通过应用
egen
total()
函数或其他方法在几行中进行计算。一般来说,如果你想在变量中得到结果,
总结
充其量只是第一步;通常可以使用一次完成此操作的命令,例如
egen
。谢谢,解释清楚!