Statistics 如何使用Stata往年的数据填写观察结果?(面板数据)
我有小组数据,在一些观察中缺少关于出生年份的信息。由于年份在整个时间序列中ID不不同,我想用一个我不知道的命令填充空白点(否则我必须手动操作) 这里有一个例子Statistics 如何使用Stata往年的数据填写观察结果?(面板数据),statistics,stata,panel-data,Statistics,Stata,Panel Data,我有小组数据,在一些观察中缺少关于出生年份的信息。由于年份在整个时间序列中ID不不同,我想用一个我不知道的命令填充空白点(否则我必须手动操作) 这里有一个例子 +--------------------------------+ | ID wave birthy~r | |--------------------------------| 1. | 010104101001 1 1965 | 2. | 01
+--------------------------------+
| ID wave birthy~r |
|--------------------------------|
1. | 010104101001 1 1965 |
2. | 010104101001 2 1965 |
3. | 010104101001 3 1965 |
4. | 010104101001 4 1965 |
5. | 010104101002 1 . |
|--------------------------------|
6. | 010104101002 2 . |
7. | 010104101002 3 1963 |
8. | 010104101002 4 1963 |
9. | 010104102001 1 1954 |
10. | 010104102001 2 . |
+--------------------------------+
在本例中,我想用第6行或第7行的信息自动替换第5行和第6行缺失的生日值。然后将第9行的生日值粘贴到第10行
bysort ID : egen min = min(birthyear)
by ID: egen max = max(birthyear)
list if min != max
bysort ID (birthyear) : replace birthyear = birthyear[1] if max == min
这段代码的大部分只是检查关于出生年份的信息是否相互矛盾(而不是覆盖任何这样的信息)