Stata中的重组变量
我是Stata的新用户,我试图了解它是如何执行命令的。我在将数据从当前格式重新构造为面板数据格式时遇到了麻烦 我使用的是公司层面的微观数据,例如,包含公司id、上一个可用年(从该公司收集数据的最近一年)和营业额(REV_LAY-0=上一个可用年的营业额-0,REV_LAY-1=上一个可用年的营业额-1等等) 目前的数据格式如下: 所需的面板格式如下所示: 在SAS中,我将在循环中执行以下操作:Stata中的重组变量,stata,panel-data,Stata,Panel Data,我是Stata的新用户,我试图了解它是如何执行命令的。我在将数据从当前格式重新构造为面板数据格式时遇到了麻烦 我使用的是公司层面的微观数据,例如,包含公司id、上一个可用年(从该公司收集数据的最近一年)和营业额(REV_LAY-0=上一个可用年的营业额-0,REV_LAY-1=上一个可用年的营业额-1等等) 目前的数据格式如下: 所需的面板格式如下所示: 在SAS中,我将在循环中执行以下操作: if last_avail_yr=2016 then do; rev_2016=rev_lay-0
if last_avail_yr=2016 then do;
rev_2016=rev_lay-0;
rev_2015=rev_lay-1;
rev_2014=rev_lay-2;
rev_2013=rev_lay-3;
end;
但我现在还不知道该怎么做。我尝试使用带有forvalues
循环的if
语句来获得类似的结果,但效果并不理想
示例数据如下所示:
MARK BvD_ID LAST_AVAIL_YR REV_LAY0 REV_LAY1 REV_LAY2 REV_LAY3 REV_LAY4
437 ESA22001721 2016 27689 32097 28992 35868 36493
438 ESF23212103 2015 26786 52095 33023 29493 40368
439 ESB45426806 2012 22072 14864 12877 15330 6403
440 ESA45039294 2015 26700 23387 21104 21272 20002
441 ESB76638790 2016 27480 24303 10699 . .
有人能帮我解决这个问题的Stata代码吗?
rev\u lay-0
等在Stata中不是有效的名称,因此我假设它们将被命名为rev\u lay\u 0
等。考虑到这一点,下面的方法应该可以做到:a
reshape long rev_lay_, i(firm_id last_avail_yr) j(id)
by firm_id last_avail_yr: gen yr = last_avail_yr - _n + 1
keep firm_id last_avail_yr rev_lay_ yr
reshape wide rev_lay_, i(firm_id last_avail_yr) j(yr)
虽然公认的答案给出了OP所要求的内容,但所需的数据布局在Stata中并不十分有用。一个
重塑long
就可以产生一个简单的布局,这对于大多数数据管理、所有图形和所有统计建模来说都是非常非常好的,使用Stata中的面板数据:
clear
input MARK str11 BvD_ID LAST_AVAIL_YR REV_LAY0 REV_LAY1 REV_LAY2 REV_LAY3 REV_LAY4
437 ESA22001721 2016 27689 32097 28992 35868 36493
438 ESF23212103 2015 26786 52095 33023 29493 40368
439 ESB45426806 2012 22072 14864 12877 15330 6403
440 ESA45039294 2015 26700 23387 21104 21272 20002
441 ESB76638790 2016 27480 24303 10699 . .
end
reshape long REV_LAY , i(BvD_ID)
gen YEAR = LAST_AVAIL_YR - _j
drop if missing(REV_LAY)
drop _j LAST
list, sepby(BvD_ID)
+-------------------------------------+
| BvD_ID MARK REV_LAY YEAR |
|-------------------------------------|
1. | ESA22001721 437 27689 2016 |
2. | ESA22001721 437 32097 2015 |
3. | ESA22001721 437 28992 2014 |
4. | ESA22001721 437 35868 2013 |
5. | ESA22001721 437 36493 2012 |
|-------------------------------------|
6. | ESA45039294 440 26700 2015 |
7. | ESA45039294 440 23387 2014 |
8. | ESA45039294 440 21104 2013 |
9. | ESA45039294 440 21272 2012 |
10. | ESA45039294 440 20002 2011 |
|-------------------------------------|
11. | ESB45426806 439 22072 2012 |
12. | ESB45426806 439 14864 2011 |
13. | ESB45426806 439 12877 2010 |
14. | ESB45426806 439 15330 2009 |
15. | ESB45426806 439 6403 2008 |
|-------------------------------------|
16. | ESB76638790 441 27480 2016 |
17. | ESB76638790 441 24303 2015 |
18. | ESB76638790 441 10699 2014 |
|-------------------------------------|
19. | ESF23212103 438 26786 2015 |
20. | ESF23212103 438 52095 2014 |
21. | ESF23212103 438 33023 2013 |
22. | ESF23212103 438 29493 2012 |
23. | ESF23212103 438 40368 2011 |
+-------------------------------------+
请将示例数据发布为SAS代码,作为其他人可以复制和粘贴的文本。这里的指导原则通常也适用。我在我的帖子中发布了示例数据。正如Mauricio所指出的,问题中描述的变量名在stata中是无效的。我这样写名字是为了让问题更清楚。我还是不太清楚。例如,我没有看到上面的
firm_id
,但它在您的图片中,@Mauricio指的是它。firm_id是BvD_id,很抱歉更改了变量的名称,并且没有在帖子中明确说明