如何创建;“非标准”;Stata中更有效的描述性统计

如何创建;“非标准”;Stata中更有效的描述性统计,stata,Stata,假设我想创建一些标量值,比如中间价/中间收入平均首付/房价。我知道我可以先使用su命令,然后从r类中分别提取分母和分子,然后创建所需的标量 然而,当我有十几个这样的标量,并且按照不同的家庭类型,这种方法在实践中是乏味的。因此,我想知道是否有任何方法可以更有效地完成上述工作?如果我能在Stata中创建一个包含这样标量的表,那就更有趣了。执行摘要:所以,不要使用标量;改用变量 有一个先前的统计问题,即(比如)汇总(y)/汇总(x)不一定等于汇总(y/x);总的来说,两者会有所不同。在我看来,后者通常

假设我想创建一些标量值,比如
中间价/中间收入
平均首付/房价
。我知道我可以先使用
su
命令,然后从r类中分别提取分母和分子,然后创建所需的标量


然而,当我有十几个这样的标量,并且按照不同的家庭类型,这种方法在实践中是乏味的。因此,我想知道是否有任何方法可以更有效地完成上述工作?如果我能在Stata中创建一个包含这样标量的表,那就更有趣了。

执行摘要:所以,不要使用标量;改用变量

有一个先前的统计问题,即(比如)汇总(y)/汇总(x)不一定等于汇总(y/x);总的来说,两者会有所不同。在我看来,后者通常更有意义,但如果不是这样,就把它放在一边

这里有一个不太疯狂的例子。在Stata汽车数据集中,每磅重量(物理学家:质量,真的)你需要为各种汽车支付多少钱(大约1978年的美元)

. sysuse auto
(1978 Automobile Data)

. gen pricePERlb = price/weight

. egen mean = mean(pricePERlb), by(rep78)

. tabstat mean, s(n mean) by(rep78)

Summary for variables: mean
     by categories of: rep78 (Repair Record 1978)

   rep78 |         N      mean
---------+--------------------
       1 |         2  1.479266
       2 |         8  1.731407
       3 |        30  1.895855
       4 |        18   2.25233
       5 |        11  2.472519
---------+--------------------
   Total |        69  2.049639
------------------------------
现在有一个小转折。此处不需要
生成
。我们本来可以走的
egen mean=平均值(价格/重量),按(rep78)


这些工具都很简单:
generate
创建新变量;
egen
创建新变量,在这里可以为组计算汇总统计信息;以及
tabstat
,以及许多其他制表命令,以显示结果。由于这里的统计数据是按组内的结构常数计算的,因此询问它们的平均值只是获取它们的几种方法之一。类似地,
图形点
图形hbar
等也可立即显示

谢谢你,尼克。事实上,我想到的第一种方法是创建变量,但就我个人而言,我“讨厌”为所有观察值创建完全相同的值集,所以我转而使用替代方法。然而,事实证明它是更聪明的一个。