Stata 将长面板数据重塑为宽面板,其中数据在ID中不唯一
我的数据集如下所示:Stata 将长面板数据重塑为宽面板,其中数据在ID中不唯一,stata,panel-data,Stata,Panel Data,我的数据集如下所示: | State | Year | Industry | Employment | |-------|------|----------|------------| | AL | 2014 | 1 | 123345 | | AL | 2015 | 1 | 145411 | | AL | 2016 | 1 | 149402 | | AL | 2014 | 2 | 153518
| State | Year | Industry | Employment |
|-------|------|----------|------------|
| AL | 2014 | 1 | 123345 |
| AL | 2015 | 1 | 145411 |
| AL | 2016 | 1 | 149402 |
| AL | 2014 | 2 | 153518 |
| AL | 2015 | 2 | 157773 |
| AL | 2016 | 2 | 163156 |
| AK | 2014 | 1 | 167187 |
| AK | 2015 | 1 | 167863 |
| AK | 2016 | 1 | 163320 |
| AK | 2014 | 2 | 162419 |
| AK | 2015 | 2 | 166116 |
| AK | 2016 | 2 | 170136 |
我希望最终得到一个如下所示的数据集:
| State | Year | Employment_Industry1 | Employment_Industry2 |
|-------|------|----------------------|----------------------|
| AL | 2014 | 123345 | 153518 |
| AL | 2015 | 145411 | 157773 |
| AL | 2016 | 149402 | 163156 |
| AK | 2014 | 167187 | 162419 |
| AK | 2015 | 167863 | 166116 |
| AK | 2016 | 163320 | 170136 |
如您所见,我拥有的数据格式很长,但年份是在州行业重复的。这会在I宽整形时引发问题
我为几个不同的变量分组生成了ID,但最后出现了一个错误,其结果是:
变量行业的值在ID中不唯一
我需要创建什么样的ID,或者我可以做些什么来创建所需的数据集?以下内容适合我:
clear
input str2 State Year Industry Employment
AL 2014 1 123345
AL 2015 1 145411
AL 2016 1 149402
AL 2014 2 153518
AL 2015 2 157773
AL 2016 2 163156
AK 2014 1 167187
AK 2015 1 167863
AK 2016 1 163320
AK 2014 2 162419
AK 2015 2 166116
AK 2016 2 170136
end
egen id = group(State)
reshape wide Employment, i(id Year) j(Industry)
drop id
order State Year Employment*
list, abbreviate(15) sepby(State)
+------------------------------------------+
| State Year Employment1 Employment2 |
|------------------------------------------|
1. | AK 2014 167187 162419 |
2. | AK 2015 167863 166116 |
3. | AK 2016 163320 170136 |
|------------------------------------------|
4. | AL 2014 123345 153518 |
5. | AL 2015 145411 157773 |
6. | AL 2016 149402 163156 |
+------------------------------------------+
尽管@Pearly Spencer给出了一个很好的答案,但问题中缺少的恰恰是你尝试过的重塑代码,以及你是如何将ID
作为一个新变量产生的。在编程论坛上,给出您使用的代码确实是关键。问题的关键在于状态
和年份
是联合标识符,因此必须告诉重塑
。