R 当一个或多个预测变量保持不变时,从二元逻辑回归绘制估计概率
我是一名生物系的研究生,就以下问题我已经转了30个小时了。总之,我想从我制作的glm二元逻辑回归模型中绘制一个估计概率图。我已经通过了模型选择,验证等,现在只是试图产生数字。我在为我选择的模型绘制概率曲线方面没有问题,但我真正感兴趣的是生成一个图,显示当另一个预测变量保持不变时,预测变量的二元结果的概率 我不知道如何将这个常量值只分配给一个预测变量,并绘制另一个变量的概率。最后,我想给出与我所附的粗略示例类似的数字。我承认我是R方面的新手,我当然很欣赏大家的时间,但我已经用尽了在线搜索,还没有找到合适的方法或解决方案。这是与我的问题相关的最接近的信息,但我发现解释含糊不清,它没有提供一个示例,用于在绘制另一个预测值的概率时为一个预测值指定一个常量值 下面我提供了一个模拟数据集和我的进度。非常感谢您的专业知识,我相信解决方案和代码示例将对其他使用逻辑回归的生态学家有所帮助 模拟数据集显示了蜥蜴在冬季的生存结果。预测变量为“质量”和“深度”R 当一个或多个预测变量保持不变时,从二元逻辑回归绘制估计概率,r,logistic-regression,R,Logistic Regression,我是一名生物系的研究生,就以下问题我已经转了30个小时了。总之,我想从我制作的glm二元逻辑回归模型中绘制一个估计概率图。我已经通过了模型选择,验证等,现在只是试图产生数字。我在为我选择的模型绘制概率曲线方面没有问题,但我真正感兴趣的是生成一个图,显示当另一个预测变量保持不变时,预测变量的二元结果的概率 我不知道如何将这个常量值只分配给一个预测变量,并绘制另一个变量的概率。最后,我想给出与我所附的粗略示例类似的数字。我承认我是R方面的新手,我当然很欣赏大家的时间,但我已经用尽了在线搜索,还没有找
xI无法从您的描述和链接的手绘图表判断您是否期望三条曲线的关系为“参数化”。它们的差异应该由一个或两个参数来描述,还是它们是不共享任何广义“形状”的独立曲线?我也不知道“蜥蜴鲍勃”指的是什么,甚至不知道一只没有名字的蜥蜴是如何进入这个问题的。请记住,我们不共享您的工作领域,如果我们想有机会了解这些数据,您可能(…不,您肯定)需要描述您的研究。在查看了Ted Harding的答案后,他被您批评为“含糊不清”,他是最受尊敬的R帮助定期响应者之一,我只能观察到,你的问题只比7年前提问者的问题稍微模糊一些。至少你提供了数据。但数据还不够。统计咨询需要对问题的背景进行实质性描述。我感谢您的评论,并为我的问题描述不当表示歉意。我只是在寻找代码来绘制逻辑回归模型的预测曲线,该模型有2个预测因子(解释变量)当其中一个预测值保持为我指定的常量值时。为什么你会认为RHS为质量+深度的模型会有多个拐点的曲线?我认为这对我来说很模糊,因为我非常缺乏经验,我无意冒犯任何人,我感谢任何花时间帮助他人的人!很明显,答案就在泰德·哈丁斯的帖子里,这让我更加沮丧,因为我无法找到答案。我已经为此苦恼了好几天了,我相信我的挫折感已经战胜了我。当我将来链接到其他人的作品时,我会更加深思熟虑和尊重。我无法从你的描述和链接的手绘图表判断你是否期望三条曲线的关系是“参数化的”。它们的差异应该由一个或两个参数来描述,还是它们是不共享任何广义“形状”的独立曲线?我也不知道“蜥蜴鲍勃”指的是什么,甚至不知道一只没有名字的蜥蜴是如何进入这个问题的。请记住,我们不共享您的工作领域,如果我们想有机会了解这些数据,您可能(…不,您肯定)需要描述您的研究。在查看了Ted Harding的答案后,他被您批评为“含糊不清”,他是最受尊敬的R帮助定期响应者之一,我只能观察到,你的问题只比7年前提问者的问题稍微模糊一些。至少你提供了数据。但数据还不够。统计咨询需要对问题的背景进行实质性描述。我感谢您的评论,并为我的问题描述不当表示歉意。我只是在寻找代码来绘制逻辑回归模型的预测曲线,该模型有2个预测因子(解释变量)当其中一个预测值保持为我指定的常量值时。为什么你会认为RHS为质量+深度的模型会有多个拐点的曲线?我认为这对我来说很模糊,因为我非常缺乏经验,我无意冒犯任何人,我感谢任何花时间帮助他人的人!很明显,答案就在泰德·哈丁斯的帖子里,这让我更加沮丧,因为我无法找到答案。我已经为此苦恼了好几天了,我相信我的挫折感已经战胜了我。将来当我链接到他人的工作时,我会更加体贴和尊重他人
x<-read.csv('logreg_example_data.csv',header = T)
x
survival mass depth
1 0 4.294456 262
2 0 8.359857 261
3 0 10.740580 257
4 0 10.740580 257
5 0 6.384678 257
6 0 6.384678 257
7 0 11.596380 270
8 0 11.596380 270
9 0 4.294456 262
10 0 4.294456 262
11 0 8.359857 261
12 0 8.359857 261
13 0 8.359857 261
14 0 7.920406 258
15 0 7.920406 258
16 0 7.920406 261
17 0 10.740580 257
18 0 10.740580 258
19 0 38.824960 262
20 0 9.916840 239
21 1 6.384678 257
22 1 6.384678 257
23 1 11.596380 270
24 1 11.596380 270
25 1 11.596380 270
26 1 23.709520 288
27 1 23.709520 288
28 1 23.709520 288
29 1 38.568970 262
30 1 38.568970 262
31 1 6.581013 295
32 1 6.581013 298
33 1 0.766564 269
34 1 5.440803 262
35 1 5.440803 262
36 1 19.534710 252
37 1 19.534710 259
38 1 8.359857 263
39 1 10.740580 257
40 1 38.824960 264
41 1 38.824960 264
42 1 41.556970 239
#Dataset name is x
# time to run the glm model
model1<-glm(formula=survival ~ mass + depth, family = "binomial", data=x)
model1
summary(model1)
#Ok now heres how i predict the probability of a lizard "Bob" surviving the winter with a mass of 32.949 grams and a burrow depth of 264 mm
newdata<-data.frame(mass = 32.949, depth = 264)
predict(model1, newdata, type = "response")
# the lizard "Bob" has a 87.3% chance of surviving the winter
#Now lets assume the glm. model was robust and the lizard was endangered,
#from all my research I know the average burrow depth is 263.9 mm at a national park
#lets say i am also interested in survival probabilities at burrow depths of 200 and 100 mm, respectively
#how do i use the valuable glm model produced above to generate a plot
#showing the probability of lizards surviving with average burrow depths stated above
#across a range of mass values from 0.0 to 100.0 grams??????????
#i know i need to use the plot and predict functions but i cannot figure out how to tell R that i
#want to use the glm model i produced to predict "survival" based on "mass" when the other predictor "depth" is held at constant values of biological relevance
#I would also like to add dashed lines for 95% CI