Stata 按ID对观察值进行分组,同时创建特征变量
我正在进行一项针对厄瓜多尔个人的调查,我想分析每个家庭的特征。每个人都有一个houseID,所以我想我需要使用这个变量对他们进行分组,同时还需要创建一些关于他们特征的额外变量:例如,如果一个家庭有两个或两个以上的女性,那么一个假人是1。我将在下面发布一个例子 我知道如何在R(groupby)中执行此操作,但在Stata中还没有找到类似的命令 我的数据的简化版本是:Stata 按ID对观察值进行分组,同时创建特征变量,stata,survey,dummy-variable,Stata,Survey,Dummy Variable,我正在进行一项针对厄瓜多尔个人的调查,我想分析每个家庭的特征。每个人都有一个houseID,所以我想我需要使用这个变量对他们进行分组,同时还需要创建一些关于他们特征的额外变量:例如,如果一个家庭有两个或两个以上的女性,那么一个假人是1。我将在下面发布一个例子 我知道如何在R(groupby)中执行此操作,但在Stata中还没有找到类似的命令 我的数据的简化版本是: houseID femaleDummy maleDummy 10000000001 1
houseID femaleDummy maleDummy
10000000001 1 0
10000000001 1 0
10000000001 0 1
10000000002 0 1
10000000002 0 1
我想得到类似的东西
houseID twoFemalesormoreDummy
10000000001 1
10000000002 0
很简单,我的朋友
gen d_female = femaleDummy == 1
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2
如果第二条语句被sort houseID:egen total_female=total(femalesdummy==1)修改为
。请注意,OP需要2个或更多,因此代码应该以>=2结尾。如果解决方案解决了您的问题,请接受它。谢谢你!我确信我做到了。这个解决方案是完美的。谢谢