R 用于分析多国数年数据的回归模型(多元回归中的辛普森悖论)?

R 用于分析多国数年数据的回归模型(多元回归中的辛普森悖论)?,r,statistics,regression,linear-regression,R,Statistics,Regression,Linear Regression,假设我有20个不同国家1990-2020年的数据: (这些变量只是虚构的) 因变量 外国直接投资流入(FDII) 独立变量: 贫困率(PR) 政府补贴(GS) 税率(TS) 我在课堂上做了一个练习,该方法证明了只需建立一个多元回归模型(即R中的lm(FDII~PR+GS+TS)),但是,这种方法似乎忽略了每个国家变量之间的关系。如果变量之间的关系在国家一级为负/正,但在国家合并时则相反,该怎么办?您所说的被称为相互作用,您将它们指定为传递给lm的公式的艺术。简单的答案是将公式中的所有+更改为*,

假设我有20个不同国家1990-2020年的数据:

(这些变量只是虚构的)

因变量 外国直接投资流入(FDII)

独立变量: 贫困率(PR) 政府补贴(GS) 税率(TS)


我在课堂上做了一个练习,该方法证明了只需建立一个多元回归模型(即R中的lm(FDII~PR+GS+TS)),但是,这种方法似乎忽略了每个国家变量之间的关系。如果变量之间的关系在国家一级为负/正,但在国家合并时则相反,该怎么办?

您所说的被称为相互作用,您将它们指定为传递给
lm
公式的艺术。简单的答案是将公式中的所有
+
更改为
*
,请参见
lm
的详细信息部分,其中部分内容是“lm的模型以符号形式指定。典型模型的形式为response ~ terms,其中response为(数字)响应向量和术语是一系列术语,用于指定响应的线性预测值。规格first*second表示第一个和第二个的交叉。这与first+second+first:second相同。“您所说的是相互作用,您将它们指定为传递给
lm
公式的艺术。简单的答案是将公式中的所有
+
更改为
*
,请参见
lm
的详细信息部分,其中部分内容是“lm的模型以符号形式指定。典型模型的形式为response ~ terms,其中response为(数字)响应向量和项是一系列项,用于指定响应的线性预测器。规格first*second表示第一个和第二个的交叉。这与first+second+first:second相同。”