Excel 在面板数据模型中创建自变量Stata
变量的数据和描述Excel 在面板数据模型中创建自变量Stata,excel,stata,Excel,Stata,变量的数据和描述 图1显示了一个平衡的面板数据,我在同一张图片中使用了一个不平衡的面板数据作为样本创建了该面板数据,其中我有多个产品(ID)用于不同的年份(年)。对于每种产品,都有不同数量的商店提供给定的产品(ID)。如前所述,这是一个平衡集,通过对相同年份、相同产品(ID)和相同商店(由样本数据中的橙色区域标记)进行排序而创建。这是一个重要的假设,可能会影响对下文所述问题的看法因此,下面是对图1所示表格的描述: 年份表示产品在给定产品(ID)中的持续时间 店铺1、店铺2、店铺3表示不同公司
- 图1显示了一个平衡的面板数据,我在同一张图片中使用了一个不平衡的面板数据作为样本创建了该面板数据,其中我有多个产品(ID)用于不同的年份(年)。对于每种产品,都有不同数量的商店提供给定的产品(ID)。如前所述,这是一个平衡集,通过对相同年份、相同产品(ID)和相同商店(由样本数据中的橙色区域标记)进行排序而创建。这是一个重要的假设,可能会影响对下文所述问题的看法因此,下面是对图1所示表格的描述:
- 年份表示产品在给定产品(ID)中的持续时间
- 店铺1、店铺2、店铺3表示不同公司对给定产品(ID)的不同价格
- 最小值和第二最小值描述给定年份的哪些商店和产品(ID)具有该给定年份的最低和第二最低价格。这是计算价差所需的,价差为**(第二个最小值-最小值)/(最小值)
- 第5行(1995年1月1日-ID 101)给出了一个例子,其中差价为(3999-3790)/3790=5,51%(在图片1中)
- 在我的平衡面板数据中,(图1),我想使用xtreg函数在STATA中运行固定效应回归,其中因变量是价格差异,销售产品的商店数量是自变量。这是,所以我可以说,当有一家店铺在销售,当有两家店铺在销售,当有三家店铺在销售时,作为因变量的价差是如何受到影响的李>
- 另一个问题是,我的假设在创建一个平衡的面板时是否有效?从非平衡面板数据创建平衡面板是正确的,还是必须使用非平衡面板创建这样的变量
- 所以我的主要问题是如何创建这样的自变量,来衡量提供产品的商店数量的维度。到 澄清我的意思,我已经包括了一个固定样本的例子 可能解释我试图解释的结构的效果回归 在下面的图片2中搜索:
- 我曾尝试在商店中使用虚拟变量,但最终被放弃了。如前所述,图1中提供的数据集是一个平衡的数据集,在paneldata上运行(我假设)固定效应回归需要它
egen number_of_firms = rownonmiss(Shop*)
xtset ID year // to use xtreg, we must tell Stata the data are panel
xtreg Price_difference i.number_of_firms
xtreg
是图2中显示的回归
如果希望公司数量变量的格式更像图2,可以执行以下操作:
qui levelsof number_of_firms, local(num)
foreach n in `num' {
local lab_def `lab_def' `n' "`n' Firms"
}
label def num_firms `lab_def'
label values number_of_firms num_firms
label var number_of_firms "Number of Firms"
然后运行回归,输出将被格式化为公司数量标签。您好,非常感谢您的回复。我添加了一些新信息,试图澄清问题的性质,以便更好地理解它。因为这个答案是在编辑之前提供的,我不应该在现有的价格变量上运行它吗?为什么要生成随机数?谢谢。我想我对你的问题还是有点不清楚。您创建的平衡面板将在所有年份中由3家公司销售每种产品,因此公司的数量始终为3家,并且不会提供任何有用的信息。您是否希望您的回归像:
reg Price\u difference number\u of \u firms i.ID
?另外,我举这个例子是因为你没有提供任何数据供我使用,所以我创建了自己的(论坛上的一些人对此很挑剔,会告诉你使用ssc安装dataex
,这样你就可以共享你的数据)啊,太棒了,是的,回归应该是这样的,那么,我不能在平衡的场景中运行它就很有意义了。假设我想在不平衡面板数据示例上运行它,然后使用shops 1-7来捕获变化,它是否仍然像示例中提供的那样?(再次感谢)我已经更新了答案,我在上面的评论中犯了一个小错误,应该是I.number\u of_firms
,这样我们就可以为该变量的每个单独值获得一个单独的系数。这在上面的答案中也是固定的。啊,好的,非常感谢。另外,作为一个小的后续问题,我想知道,在面板数据(或如何)或统计数据中,您认为什么类型的方法适合捕捉这种价格差距随时间发生的性质?我的意思是,如果我们看看不平衡的面板数据,我们会发现当以最低价格提供产品的商店数量为1时,就会出现价格差距。当以最低价格发行的公司数量超过1家时,价格分散就不再存在,那么如何在面板数据中解释这一模式,以及各sho之间的变化