R-assistance中的基本回归模型
我开始深入研究R并自学基础知识,我想通过一些命令寻求帮助 我试图使用从文本文件中提取的数据集来理解以下概念: 首先,这里是文本文档的前几行:R-assistance中的基本回归模型,r,R,我开始深入研究R并自学基础知识,我想通过一些命令寻求帮助 我试图使用从文本文件中提取的数据集来理解以下概念: 首先,这里是文本文档的前几行: salary totcomp tenure age sales profits assets Industry 24222.39 58936.87 7 61 161315 2956 257389 2 24048.97 59219.46 0 51 14
salary totcomp tenure age sales profits assets Industry
24222.39 58936.87 7 61 161315 2956 257389 2
24048.97 59219.46 0 51 144416 22071 237545 3
23172.99 56814.47 11 63 139208 4430 49271 2
23431.15 56971.3 6 60 100697 6370 92630 3
22049.87 55596.23 18 63 100469 9296 355935 3
创建相关表
salary<-read.table(file="C:/Users/sean/Desktop/ceosalary.txt", header = TRUE,sep="\t")
attach(salary)
cor(salary[-c(1,4,6)])
使用这些命令是否正确?您的模型不是多元回归模型。这是一个简单的线性回归。lm函数的公式也可以是y~x形式,而不是y-x形式。这里y是因变量,x是自变量 在R中,您应该这样编码:
fit <- lm(profits~Industry, data=salary)
summary(fit)
您希望适合哪种型号?你是想根据利润来预测薪水吗?然后您需要
lm(薪水~利润)
而不是lm(薪水~利润)
——请注意波浪号“~”而不是减号。前者用于指定R中的公式。此外,我建议避免使用attach()
。它真的会很快弄乱你的搜索路径,而且大多数函数都有一个data=
参数,所以它不是必需的。例如:lm(工资~利润,数据=工资)
还可以打印拟合的再增长模型的方差分析表,例如使用fit No,我试图根据行业、销售、年龄预测利润。利润是自变量。听起来像是你有独立和相依性。如果你试图根据行业、销售额和年龄预测利润,你不认为利润取决于其他变量吗?然后模型将是fit
anova(lm)
fit <- lm(profits~Industry, data=salary)
summary(fit)
fit <- lm(profits~Industry+tenure+age, data=salary)
summary(fit)
anova(fit)