Stata省略';共线';交互项后的变量

Stata省略';共线';交互项后的变量,stata,interaction,multicollinearity,Stata,Interaction,Multicollinearity,在Stata中,我最近发现,当我在一个回归模型中跨多个交互项使用同一变量时,Stata将该变量标记为共线。例如,运行: 回归dep i.性别##c.年龄i.种族##c.年龄 标记以下消息: 注:由于共线性,年龄被省略 年龄仍然包括在随后的回归表中,但有两次,第一次使用系数SE等,正如人们所期望的那样,但第二次说省略了 我以前做过很多次类似的分析,但从来没有这样做过(或者至少从来没有注意到)。这是不和谐的,因为不用说,年龄与年龄是共线的。但这并不重要,因为我并不是在试图同时输入两个叫做“年龄”的变

在Stata中,我最近发现,当我在一个回归模型中跨多个交互项使用同一变量时,Stata将该变量标记为共线。例如,运行:

回归dep i.性别##c.年龄i.种族##c.年龄

标记以下消息:

注:由于共线性,年龄被省略

年龄仍然包括在随后的回归表中,但有两次,第一次使用系数SE等,正如人们所期望的那样,但第二次说
省略了


我以前做过很多次类似的分析,但从来没有这样做过(或者至少从来没有注意到)。这是不和谐的,因为不用说,年龄与年龄是共线的。但这并不重要,因为我并不是在试图同时输入两个叫做“年龄”的变量。很明显,这是一个变量,我用在两个相互作用项中。是否有其他人遇到过这种情况,他们知道抑制它的方法吗?

是的,stata不会解析输入以检查变量是否完全相同,但您可以使用
noommited
选项抑制由于多线性变量而导致的ommited,或者确保每个变量在回归中只包含一次,对交互项使用单个
#

sysuse nlsw88
注册工资i.south#c.age i.union#c.age
reg工资i.south##c.age i.union#c.age i.union//每人一份
登记工资年龄
reg工资年龄,无限制//抑制输出。
另一个可能的问题是,通过构造多个交互项来使用稀疏数据,并且对于生成的虚拟变量(所有“1”或所有“0”)只有一种观察。请参见下一个示例

cls
注册工资i.south###年龄//运行良好
如果年龄==46,则替换南方=1
reg工资i.south###年龄//注:1.south#46.age因共线性而省略
注册工资i.south##c.age//运行良好

无论如何,我不确定这是否适用于你的问题,因为你在与种族和性别互动的持续
年龄上明显倒退。我认为使用连续变量时不会出现这个问题。也许?

是的,stata不会解析输入以检查变量是否完全相同,但您可以使用
noommited
选项抑制由于多线性变量引起的ommited,或者通过使用交互项的单个
确保在回归中只包含每个变量一次

sysuse nlsw88
注册工资i.south#c.age i.union#c.age
reg工资i.south##c.age i.union#c.age i.union//每人一份
登记工资年龄
reg工资年龄,无限制//抑制输出。
另一个可能的问题是,通过构造多个交互项来使用稀疏数据,并且对于生成的虚拟变量(所有“1”或所有“0”)只有一种观察。请参见下一个示例

cls
注册工资i.south###年龄//运行良好
如果年龄==46,则替换南方=1
reg工资i.south###年龄//注:1.south#46.age因共线性而省略
注册工资i.south##c.age//运行良好
无论如何,我不确定这是否适用于你的问题,因为你在与种族和性别互动的持续
年龄上明显倒退。我认为使用连续变量时不会出现这个问题。也许吧