Sorting 将bysort与多个变量一起使用时会产生不同的结果
当我只对一个变量使用bysort前缀并生成另一个变量的平均值时,我得到一组值,例如42、43、39等 当我对两个变量使用bysort并生成类似的平均值时,我会得到不同的值,例如49、48、51等。我想了解这些值的含义Sorting 将bysort与多个变量一起使用时会产生不同的结果,sorting,stata,Sorting,Stata,当我只对一个变量使用bysort前缀并生成另一个变量的平均值时,我得到一组值,例如42、43、39等 当我对两个变量使用bysort并生成类似的平均值时,我会得到不同的值,例如49、48、51等。我想了解这些值的含义 bysort date isCentralPark: egen cpdailymean = mean(temperature) 在第一种情况下,我想我得到的是按日期排序的变量的平均温度,换句话说,每日平均温度 在第二个例子中,我得到的是中央公园的日平均温度还是其他什么?这类帮助文
bysort date isCentralPark: egen cpdailymean = mean(temperature)
在第一种情况下,我想我得到的是按日期排序的变量的平均温度,换句话说,每日平均温度
在第二个例子中,我得到的是中央公园的日平均温度还是其他什么?这类帮助文件清楚地说明:
“排序”将当前数据的观测值按以下顺序升序排列:
varlist中变量的值
by的帮助文件还明确指出:
…通过为每组观测重复命令,其中
varlist中的变量是相同的
所以bysort只是在aby操作之前对数据进行排序
您需要仔细研究帮助文件中提供的大量示例,然后才能在这里就一些非常基本的问题提问
作为
解释,
…了解基本知识是无法替代的
Stata的概念和语法
在缺少示例数据的情况下,尽管多次请求,您仍未能
这里提供一个简单的示例,说明varlist如何影响bysort:
bysort date isCentralPark: egen cpdailymean = mean(temperature)
clear
set obs 15
set seed 1234567890
egen id = seq(), block(5)
generate a = rnormal()
bysort id: generate n1 = _n
list
+---------------------+
| id a n1 |
|---------------------|
1. | 1 -.6953015 1 |
2. | 1 -.5804186 2 |
3. | 1 -1.938336 3 |
4. | 1 .9347979 4 |
5. | 1 -.767854 5 |
|---------------------|
6. | 2 .3776966 1 |
7. | 2 -.5545912 2 |
8. | 2 -.0636268 3 |
9. | 2 2.041136 4 |
10. | 2 -.2200604 5 |
|---------------------|
11. | 3 .5418512 1 |
12. | 3 1.174645 2 |
13. | 3 .3234408 3 |
14. | 3 -.544277 4 |
15. | 3 .2121655 5 |
+---------------------+
bysort id a: generate n2 = _n
list
+--------------------------+
| id a n1 n2 |
|--------------------------|
1. | 1 -1.938336 3 1 |
2. | 1 -.767854 5 1 |
3. | 1 -.6953015 1 1 |
4. | 1 -.5804186 2 1 |
5. | 1 .9347979 4 1 |
|--------------------------|
6. | 2 -.5545912 2 1 |
7. | 2 -.2200604 5 1 |
8. | 2 -.0636268 3 1 |
9. | 2 .3776966 1 1 |
10. | 2 2.041136 4 1 |
|--------------------------|
11. | 3 -.544277 4 1 |
12. | 3 .2121655 5 1 |
13. | 3 .3234408 3 1 |
14. | 3 .5418512 1 1 |
15. | 3 1.174645 2 1 |
+--------------------------+
bysort id (a): generate n3 = _n
list
+-------------------------------+
| id a n1 n2 n3 |
|-------------------------------|
1. | 1 -1.938336 3 1 1 |
2. | 1 -.767854 5 1 2 |
3. | 1 -.6953015 1 1 3 |
4. | 1 -.5804186 2 1 4 |
5. | 1 .9347979 4 1 5 |
|-------------------------------|
6. | 2 -.5545912 2 1 1 |
7. | 2 -.2200604 5 1 2 |
8. | 2 -.0636268 3 1 3 |
9. | 2 .3776966 1 1 4 |
10. | 2 2.041136 4 1 5 |
|-------------------------------|
11. | 3 -.544277 4 1 1 |
12. | 3 .2121655 5 1 2 |
13. | 3 .3234408 3 1 3 |
14. | 3 .5418512 1 1 4 |
15. | 3 1.174645 2 1 5 |
+-------------------------------+