Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/powershell/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
多元线性回归与R的均方误差_R_Linear Regression - Fatal编程技术网

多元线性回归与R的均方误差

多元线性回归与R的均方误差,r,linear-regression,R,Linear Regression,有一个数据集(在这里找到-),我为线性回归做了一些R编码。在附加的数据集中,列没有标记。我必须标记数据集的列并将其保存为csv,很抱歉,我无法在这里获得这些信息……但我使用的列是第3列(年龄)、第4列(感染)、第5列(文化比率)、第10列(普查)和第12列(服务)、第9列(地区)。我给医院起名 我应该“对于每个地理区域,使用一阶回归模型,将感染风险(Y)与预测变量年龄、死亡率、人口普查、服务进行回归。然后我需要找到每个区域的MSE。这是我的代码 NE<- subset(hospital,

有一个数据集(在这里找到-),我为线性回归做了一些R编码。在附加的数据集中,列没有标记。我必须标记数据集的列并将其保存为csv,很抱歉,我无法在这里获得这些信息……但我使用的列是第3列(年龄)、第4列(感染)、第5列(文化比率)、第10列(普查)和第12列(服务)、第9列(地区)。我给医院起名

我应该“对于每个地理区域,使用一阶回归模型,将感染风险(Y)与预测变量年龄、死亡率、人口普查、服务进行回归。然后我需要找到每个区域的MSE。这是我的代码

NE<- subset(hospital, region=="1")
NC<- subset(hospital, region=="2")
S<- subset(hospital, region=="3")
W<- subset(hospital, region=="4")

NE将我的评论移动到答案。“错误”或“残差”是模型对象的一部分,
NE.model$residuals
,因此获得均方误差非常简单:
mean(NE.model$residuals^2)


需要注意的是,通过在模型中拟合一个
区域
固定效应项,然后计算每个残差子集的MSE,您可以用更少的步骤来实现这一点。实际上,相同的差异。

平均值(NE.model$residuals^2)
应该有效。非常感谢..我还有一个问题,但我现在无法发布,因为我刚刚发布了这个问题。在这种情况下,如何找到两个变量之间关系的98%置信区间?我有代码g@hk47我喜欢
arm
包,因为它的
se.coef
函数可以提取系数的标准误差。因此,CI的宽度是
se.coef(NE.Model)
乘以您想要的任何α水平,例如
qnorm(0.975)
为95%或
qnorm(0.99)
为98%。
NE.Model<- lm(NE$infection~ NE$age + NE$culratio + NE$census + NE$service)
summary(NE.Model)