Stata egen group()是否可以生成实际值而不是1、2、3、,。。。。。?
关于: 要从现有变量oldid创建新变量newid, oldid是字符串还是数字,请键入Stata egen group()是否可以生成实际值而不是1、2、3、,。。。。。?,stata,Stata,关于: 要从现有变量oldid创建新变量newid, oldid是字符串还是数字,请键入 . egen newid = group(oldid) 新变量newid的第一个值为1,第二个值为2,依此类推 开 group命令能否生成分组变量的实际值,而不是1、2、3。。。。?例如,在以下数据集中 clear input units price sku week store subc 35 4.3 1 1 1 1 23 3 2 1 1 1 12
. egen newid = group(oldid)
新变量newid的第一个值为1,第二个值为2,依此类推
开
group命令能否生成分组变量的实际值,而不是1、2、3。。。。?例如,在以下数据集中
clear
input units price sku week store subc
35 4.3 1 1 1 1
23 3 2 1 1 1
12 2.5 3 1 1 2
10 1 4 1 1 2
35 12 5 1 1 2
35 12 6 1 1 3
35 5.3 1 2 1 1
23 4 2 2 1 1
12 3.5 3 2 1 2
10 2 4 2 1 2
35 13 5 2 1 2
35 13 6 2 1 3
end
如何修改命令egen long joint=groupsubc sku,使关节的实际值为:
clear
input units price sku week store subc joint
35 4.3 1 1 1 1 1_1
23 3 2 1 1 1 1_2
12 2.5 3 1 1 2 2_3
10 1 4 1 1 2 2_4
35 12 5 1 1 2 2_5
35 12 6 1 1 3
35 5.3 1 2 1 1
23 4 2 2 1 1
12 3.5 3 2 1 2
10 2 4 2 1 2
35 13 5 2 1 2
35 13 6 2 1 3
end
或者一般来说,如何确保group命令的结果不被Stata修改
变量subc和sku的串联不是一个选项,因为它不会在forval循环中提供所需的结果。group是一个egen函数,而不是命令
连接为您提供了确切的指定内容。这个怎么了
clear
input units price sku week store subc
35 4.3 1 1 1 1
23 3 2 1 1 1
12 2.5 3 1 1 2
10 1 4 1 1 2
35 12 5 1 1 2
35 12 6 1 1 3
35 5.3 1 2 1 1
23 4 2 2 1 1
12 3.5 3 2 1 2
10 2 4 2 1 2
35 13 5 2 1 2
35 13 6 2 1 3
end
egen joint = concat(subc sku), p(_)
list , sepby(subc)
+---------------------------------------------------+
| units price sku week store subc joint |
|---------------------------------------------------|
1. | 35 4.3 1 1 1 1 1_1 |
2. | 23 3 2 1 1 1 1_2 |
|---------------------------------------------------|
3. | 12 2.5 3 1 1 2 2_3 |
4. | 10 1 4 1 1 2 2_4 |
5. | 35 12 5 1 1 2 2_5 |
|---------------------------------------------------|
6. | 35 12 6 1 1 3 3_6 |
|---------------------------------------------------|
7. | 35 5.3 1 2 1 1 1_1 |
8. | 23 4 2 2 1 1 1_2 |
|---------------------------------------------------|
9. | 12 3.5 3 2 1 2 2_3 |
10. | 10 2 4 2 1 2 2_4 |
11. | 35 13 5 2 1 2 2_5 |
|---------------------------------------------------|
12. | 35 13 6 2 1 3 3_6 |
+---------------------------------------------------+
这篇文章参考了我之前关于循环的文章。在示例数据集上,forval代码运行良好。但当我将其应用于实际的187K obs数据集时,它给出了以下错误:生成187177个缺失值[重复67次];变量ETA2598已定义。我发现问题出在group命令上。换句话说,这个解决方案不适用于大型数据集,但适用于示例数据集。我正试图找出原因。对不起,这些评论没有帮助。您是在断言,而不是表明使用group函数时存在问题。eta2_598在您使用的任何命令中是如何使用的?这与这里的问题无关。