用R预测概率

用R预测概率,r,R,我在R中创建的模型是: fit <- lm(hired ~ educ + exper + sex, data=data) fit所以我尽力解释我找到的glm注释,这就是我想到的 > test<-glm(hired ~ educ + exper + sex, data=data, family=binomial()) > summary(test) Call: glm(formula = hired ~ educ + exper + sex, family =

我在R中创建的模型是:

fit <- lm(hired ~ educ + exper + sex, data=data)

fit所以我尽力解释我找到的glm注释,这就是我想到的

 > test<-glm(hired ~ educ + exper + sex, data=data, family=binomial())
 > summary(test)

 Call:
 glm(formula = hired ~ educ + exper + sex, family = binomial(), 
     data = data)

 Deviance Residuals: 
     Min       1Q   Median       3Q      Max  
 -1.4380  -0.4573  -0.1009   0.1294   2.1804  

 Coefficients:
             Estimate Std. Error z value Pr(>|z|)  
 (Intercept) -14.2483     6.0805  -2.343   0.0191 *
 educ          1.1549     0.6023   1.917   0.0552 .
 exper         0.9098     0.4293   2.119   0.0341 *
 sex           5.6037     2.6028   2.153   0.0313 *
 ---
 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

 (Dispersion parameter for binomial family taken to be 1)

     Null deviance: 35.165  on 27  degrees of freedom
 Residual deviance: 14.735  on 24  degrees of freedom
 AIC: 22.735

 Number of Fisher Scoring iterations: 7
>测试摘要(测试)
电话:
glm(公式=雇佣~教育+经验+性别,家庭=二项式(),
数据=数据)
偏差残差:
最小1季度中值3季度最大值
-1.4380  -0.4573  -0.1009   0.1294   2.1804  
系数:
估计标准误差z值Pr(>z)
(截距)-14.24836.0805-2.3430.0191*
educ 1.1549 0.6023 1.917 0.0552。
exper 0.9098 0.4293 2.119 0.0341*
性别5.6037 2.6028 2.153 0.0313*
---
签名。代码:0'***'0.001'***'0.01'*'0.05'.'0.1''1
(二项式族的离散参数取为1)
零偏差:27个自由度上的35.165
剩余偏差:24自由度时为14.735
AIC:22.735
Fisher评分迭代次数:7

对于使用
glm
估计的模型,您可以使用
predict
函数提取数据集中每个观测值的线性预测值。然后,您可以简单地使用适当的概率分布函数来获得预测的概率。例如,在逻辑回归的情况下,使用
plogis
。换句话说,如果
mod
模型是否适合
glm

> plogis(predict(mod))
将返回数据集中每个观测值的预测概率,假设您估计了逻辑模型。如果需要计算不在数据集中的点的预测概率,请参阅
predict
newdata
选项。请注意,
predict
还可以在每个点提供标准误差。有关更多信息,请参阅
predict.glm
的文档

编辑:根据Greg的建议,您可以在调用
predict
中使用
type=“response”
免费获取
plogis

> predict(mod, type="response")

您可以查看
glm
功能。非常感谢刘敏照的快速响应。你能详细介绍一下吗?因为我确实看过glm函数,但我不知道怎么做。对不起,我是R新手。使用线性模型来估计概率,你必须做出一些假设。我不确定线性模型是这里最好的模型。相反,你可以考虑使用贝叶斯分类器。你可以用fit$fit作为概率的估计值,是这样的吗?fit我很乐意接受建议MattD你能扩展一下你的思维过程吗?或者使用glm对象的
predict
函数的参数自动生成所需比例的预测。感谢大家的洞察力,我对我的帖子进行了编辑。