Excel 在面板数据模型中创建自变量Stata

Excel 在面板数据模型中创建自变量Stata,excel,stata,Excel,Stata,变量的数据和描述 图1显示了一个平衡的面板数据,我在同一张图片中使用了一个不平衡的面板数据作为样本创建了该面板数据,其中我有多个产品(ID)用于不同的年份(年)。对于每种产品,都有不同数量的商店提供给定的产品(ID)。如前所述,这是一个平衡集,通过对相同年份、相同产品(ID)和相同商店(由样本数据中的橙色区域标记)进行排序而创建。这是一个重要的假设,可能会影响对下文所述问题的看法因此,下面是对图1所示表格的描述: 年份表示产品在给定产品(ID)中的持续时间 店铺1、店铺2、店铺3表示不同公司

变量的数据和描述

  • 图1显示了一个平衡的面板数据,我在同一张图片中使用了一个不平衡的面板数据作为样本创建了该面板数据,其中我有多个产品(ID)用于不同的年份(年)。对于每种产品,都有不同数量的商店提供给定的产品(ID)。如前所述,这是一个平衡集,通过对相同年份、相同产品(ID)和相同商店(由样本数据中的橙色区域标记)进行排序而创建。这是一个重要的假设,可能会影响对下文所述问题的看法因此,下面是对图1所示表格的描述:
  • 年份表示产品在给定产品(ID)中的持续时间
  • 店铺1、店铺2、店铺3表示不同公司对给定产品(ID)的不同价格
  • 最小值和第二最小值描述给定年份的哪些商店和产品(ID)具有该给定年份的最低和第二最低价格。这是计算价差所需的,价差为**(第二个最小值-最小值)/(最小值)
  • 第5行(1995年1月1日-ID 101)给出了一个例子,其中差价为(3999-3790)/3790=5,51%(在图片1中)
发行

  • 在我的平衡面板数据中,(图1),我想使用xtreg函数在STATA中运行固定效应回归,其中因变量是价格差异,销售产品的商店数量是自变量。这是,所以我可以说,当有一家店铺在销售,当有两家店铺在销售,当有三家店铺在销售时,作为因变量的价差是如何受到影响的
  • 另一个问题是,我的假设在创建一个平衡的面板时是否有效?从非平衡面板数据创建平衡面板是正确的,还是必须使用非平衡面板创建这样的变量

  • 所以我的主要问题是如何创建这样的自变量,来衡量提供产品的商店数量的维度。到 澄清我的意思,我已经包括了一个固定样本的例子 可能解释我试图解释的结构的效果回归 在下面的图片2中搜索:

注意(在图片2中右边的预期单元格平均值与图片1中的价差相同,并用作因变量。它们以公司/商店的数量作为自变量进行回归,我有一个问题)

我试过的

  • 我曾尝试在商店中使用虚拟变量,但最终被放弃了。如前所述,图1中提供的数据集是一个平衡的数据集,在paneldata上运行(我假设)固定效应回归需要它
结束语

早些时候,我以一种更加不精确的方式提出了这个问题,对于由此带来的不便,我深表歉意。我认为,问题可能是我在excel中设置错误,因此会删除虚拟对象,或者类似的东西。也可能是,为了创建这个自变量,我必须使用不平衡集,所以这也可能是一个问题,我试图使用平衡集而不是不平衡集。

在您的不平衡样本中(正如我们在评论中讨论的,平衡样本没有意义)我们首先需要为提供每个ID的店铺数量创建一个变量,假设我们拥有与图片1顶部相同的数据

egen number_of_firms = rownonmiss(Shop*)
xtset ID year // to use xtreg, we must tell Stata the data are panel
xtreg Price_difference i.number_of_firms
xtreg
是图2中显示的回归

如果希望公司数量变量的格式更像图2,可以执行以下操作:

qui levelsof number_of_firms, local(num)
foreach n in `num' {
    local lab_def `lab_def' `n' "`n' Firms"

}
label def num_firms `lab_def'
label values number_of_firms num_firms
label var number_of_firms "Number of Firms"

然后运行回归,输出将被格式化为公司数量标签。

您好,非常感谢您的回复。我添加了一些新信息,试图澄清问题的性质,以便更好地理解它。因为这个答案是在编辑之前提供的,我不应该在现有的价格变量上运行它吗?为什么要生成随机数?谢谢。我想我对你的问题还是有点不清楚。您创建的平衡面板将在所有年份中由3家公司销售每种产品,因此公司的数量始终为3家,并且不会提供任何有用的信息。您是否希望您的回归像:
reg Price\u difference number\u of \u firms i.ID
?另外,我举这个例子是因为你没有提供任何数据供我使用,所以我创建了自己的(论坛上的一些人对此很挑剔,会告诉你使用
ssc安装dataex
,这样你就可以共享你的数据)啊,太棒了,是的,回归应该是这样的,那么,我不能在平衡的场景中运行它就很有意义了。假设我想在不平衡面板数据示例上运行它,然后使用shops 1-7来捕获变化,它是否仍然像示例中提供的那样?(再次感谢)我已经更新了答案,我在上面的评论中犯了一个小错误,应该是
I.number\u of_firms
,这样我们就可以为该变量的每个单独值获得一个单独的系数。这在上面的答案中也是固定的。啊,好的,非常感谢。另外,作为一个小的后续问题,我想知道,在面板数据(或如何)或统计数据中,您认为什么类型的方法适合捕捉这种价格差距随时间发生的性质?我的意思是,如果我们看看不平衡的面板数据,我们会发现当以最低价格提供产品的商店数量为1时,就会出现价格差距。当以最低价格发行的公司数量超过1家时,价格分散就不再存在,那么如何在面板数据中解释这一模式,以及各sho之间的变化