R 逻辑回归替代解释

R 逻辑回归替代解释,r,machine-learning,statistics,regression,logistic-regression,R,Machine Learning,Statistics,Regression,Logistic Regression,我试图分析显示人们是否染上这种疾病的数据。也就是说,响应是二进制的。我应用逻辑回归。假设log.reg(逻辑回归)的结果如下: 我能说ID=3的人80%会得病吗?这是正确的方法吗?若否,原因为何?我很困惑,任何帮助都会很好 第二个问题是,除了将模型结果四舍五入为0或1之外,我如何计算准确率。因为我认为把0.49四舍五入到0是没有意义的。 例如,基于大于或小于0.5,模型输出将变为0,0,1,0,而不是0.01、0.4、0.8、0.49。准确率为75%。还有其他的计算方法吗 谢谢 我能说ID=3的

我试图分析显示人们是否染上这种疾病的数据。也就是说,响应是二进制的。我应用逻辑回归。假设
log.reg
(逻辑回归)的结果如下:

我能说ID=3的人80%会得病吗?这是正确的方法吗?若否,原因为何?我很困惑,任何帮助都会很好

第二个问题是,除了将模型结果四舍五入为0或1之外,我如何计算准确率。因为我认为把0.49四舍五入到0是没有意义的。 例如,基于大于或小于0.5,模型输出将变为0,0,1,0,而不是0.01、0.4、0.8、0.49。准确率为75%。还有其他的计算方法吗

谢谢

我能说ID=3的人80%会得病吗

不清楚你所说的“at”是什么意思;这里对逻辑回归输出的传统/传统解释是,模型估计3人将感染疾病,置信度为80%。也不清楚你在标题中所说的“备选方案”是什么意思(你没有在问题正文中详细说明)

除了将模型结果四舍五入为0或1外,我如何计算准确率

根据定义,精度要求将模型结果四舍五入为0/1。但是,至少在原则上,决策阈值不一定是0.5

因为我认为把0.49四舍五入到0是没有意义的

你认为0.49到1的四舍五入更有意义吗?因为这是在二元分类设置中唯一的选择(一个人要么会感染疾病,要么不会)

关于日志损失指标,评论中提到:其作用与准确性完全不同。你可能会发现我的这些相关答案很有帮助:

(尽管标题有误,但与Keras无关)


我郑重地建议您看看一些逻辑回归教程(实际上有数百个);一个强烈推荐的来源是教科书,由作者免费提供…

看看日志损失分数,我想你正在寻找一个不同的评分标准看看维基对逻辑回归的解释和解释:你建议的链接非常有用。非常感谢你!
ID = c(1,2,3,4)
Test_Data = c(0,1,1,0)
Log.Reg_Output = c(0.01,0.4,0.8,0.49)
result = data.frame(ID,Test_Data,Reg_Output)

result

# 1   | 0 |  0.01  
# 2   | 1 |  0.4    
# 3   | 1 |  0.8    
# 4   | 0 |  0.49