如何创建;“非标准”;Stata中更有效的描述性统计
假设我想创建一些标量值,比如如何创建;“非标准”;Stata中更有效的描述性统计,stata,Stata,假设我想创建一些标量值,比如中间价/中间收入平均首付/房价。我知道我可以先使用su命令,然后从r类中分别提取分母和分子,然后创建所需的标量 然而,当我有十几个这样的标量,并且按照不同的家庭类型,这种方法在实践中是乏味的。因此,我想知道是否有任何方法可以更有效地完成上述工作?如果我能在Stata中创建一个包含这样标量的表,那就更有趣了。执行摘要:所以,不要使用标量;改用变量 有一个先前的统计问题,即(比如)汇总(y)/汇总(x)不一定等于汇总(y/x);总的来说,两者会有所不同。在我看来,后者通常
中间价/中间收入平均首付/房价。我知道我可以先使用su
命令,然后从r类中分别提取分母和分子,然后创建所需的标量
然而,当我有十几个这样的标量,并且按照不同的家庭类型,这种方法在实践中是乏味的。因此,我想知道是否有任何方法可以更有效地完成上述工作?如果我能在Stata中创建一个包含这样标量的表,那就更有趣了。执行摘要:所以,不要使用标量;改用变量
有一个先前的统计问题,即(比如)汇总(y)/汇总(x)不一定等于汇总(y/x);总的来说,两者会有所不同。在我看来,后者通常更有意义,但如果不是这样,就把它放在一边
这里有一个不太疯狂的例子。在Stata汽车数据集中,每磅重量(物理学家:质量,真的)你需要为各种汽车支付多少钱(大约1978年的美元)
. sysuse auto
(1978 Automobile Data)
. gen pricePERlb = price/weight
. egen mean = mean(pricePERlb), by(rep78)
. tabstat mean, s(n mean) by(rep78)
Summary for variables: mean
by categories of: rep78 (Repair Record 1978)
rep78 | N mean
---------+--------------------
1 | 2 1.479266
2 | 8 1.731407
3 | 30 1.895855
4 | 18 2.25233
5 | 11 2.472519
---------+--------------------
Total | 69 2.049639
------------------------------
现在有一个小转折。此处不需要生成。我们本来可以走的
egen mean=平均值(价格/重量),按(rep78)
这些工具都很简单:generate
创建新变量;egen
创建新变量,在这里可以为组计算汇总统计信息;以及tabstat
,以及许多其他制表命令,以显示结果。由于这里的统计数据是按组内的结构常数计算的,因此询问它们的平均值只是获取它们的几种方法之一。类似地,图形点
,图形hbar
等也可立即显示 谢谢你,尼克。事实上,我想到的第一种方法是创建变量,但就我个人而言,我“讨厌”为所有观察值创建完全相同的值集,所以我转而使用替代方法。然而,事实证明它是更聪明的一个。