R 错误:请提供起始值

R 错误:请提供起始值,r,error-handling,regression,glm,R,Error Handling,Regression,Glm,我正在R中进行对数二项回归。我想控制模型中的协变量(年龄和BMI-两个连续变量),而因变量是结果(是或否),自变量是组(1或2) 我尝试过不同的起始值组合,例如: set.seed(123)经过一些尝试和错误后,使用set.seed(123): coefini=coef(glm(结果~组+年龄,数据=数据1,家庭=二项式(link=“log”)) fit2 | z |) (截距)-1.5816964 1.0616813-1.490 0.136 第1组0.4987848 0.3958399 1.2

我正在R中进行对数二项回归。我想控制模型中的协变量(年龄和BMI-两个连续变量),而因变量是结果(是或否),自变量是组(1或2)

我尝试过不同的起始值组合,例如:


set.seed(123)
经过一些尝试和错误后,使用
set.seed(123)

coefini=coef(glm(结果~组+年龄,数据=数据1,家庭=二项式(link=“log”))
fit2 | z |)
(截距)-1.5816964 1.0616813-1.490 0.136
第1组0.4987848 0.3958399 1.260 0.208
年龄0.0091428 0.0138985 0.658 0.511
体重指数-0.0005498 0.0331120-0.017 0.987
(二项式族的离散参数取为1)
零偏差:在49个自由度上为65.342
剩余偏差:46自由度时为63.456
AIC:71.456
Fisher评分迭代次数:3

什么是
类型(数据1$BMI)
?为什么使用日志链接而不是logit?类型(数据1$BMI)是双精度的。我使用日志链接而不是logit,因为我想要相对风险估计,而不是优势比。这是正确的方式吗?看看这篇文章的评论,似乎OR是更好的建模方式。谢谢你们的提问和回答!我一直在尝试使用R测试与带有log-link函数的二项式结果变量的关联,并且不断得到“无有效集…”错误。看起来这个解决方案对我也有效。两个方案都投了赞成票。我认为这不会让我再次投票
fit<-glm(Outcome~Group, data=data.1, family=binomial(link="log"))
Error: no valid set of coefficients has been found: please supply starting values
Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  : 
  length of 'start' should equal 4 and correspond to initial coefs for c("(Intercept)", "group1", "age", "bmi")
N=50
data.1=data.frame(Outcome=sample(c(0,0,1),N, rep=T),Age=runif(N,8,58),BMI=rnorm(N,25,6),
                  Group=rep(c(0,1),length.out=N))
data.1$Group<-as.factor(data.1$Group)
fit<-glm(Outcome~Group, data=data.1, family=binomial(link="log"))
coefini=coef(glm(Outcome~Group+Age+BMI, data=data.1,family =binomial(link = "logit") ))
fit<-glm(Outcome~Group+Age+BMI, data=data.1, family=binomial(link="log"),start=coefini)
coefini=coef(glm(Outcome~Group+Age, data=data.1,family =binomial(link = "log") ))
fit2<-glm(Outcome~Group+Age+BMI, data=data.1, family=binomial(link="log"),start=c(coefini,0))

summary(fit2)

Call:
glm(formula = Outcome ~ Group + Age + BMI, family = binomial(link = "log"), 
    data = data.1, start = c(coefini, 0))

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.2457  -0.9699  -0.7725   1.2737   1.6799  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.5816964  1.0616813  -1.490    0.136
Group1       0.4987848  0.3958399   1.260    0.208
Age          0.0091428  0.0138985   0.658    0.511
BMI         -0.0005498  0.0331120  -0.017    0.987

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 65.342  on 49  degrees of freedom
Residual deviance: 63.456  on 46  degrees of freedom
AIC: 71.456

Number of Fisher Scoring iterations: 3