Statistics 从R

Statistics 从R,statistics,logistic-regression,Statistics,Logistic Regression,全部, 我对一组变量(包括分类变量和连续变量)进行了逻辑回归,以二元事件作为因变量 现在,在建模后,我观察到一组分类变量显示负号,我认为这是为了理解,如果分类变量出现的次数较多,则因变量出现的概率较低 但当我看到自变量出现的百分比时,我看到了相反的趋势。因此,结果似乎与直觉相反。任何可能发生这种情况的原因。我试着在下面用一个伪例子来解释 因变量-E 预测因素: 1.分类变量-Cat1,具有2个级别(0,1) 2.连续Var-Con1 3.分类变量-2级Cat2(0,1) 建模后: 假设所有都是有

全部,

我对一组变量(包括分类变量和连续变量)进行了逻辑回归,以二元事件作为因变量

现在,在建模后,我观察到一组分类变量显示负号,我认为这是为了理解,如果分类变量出现的次数较多,则因变量出现的概率较低

但当我看到自变量出现的百分比时,我看到了相反的趋势。因此,结果似乎与直觉相反。任何可能发生这种情况的原因。我试着在下面用一个伪例子来解释

因变量-E 预测因素: 1.分类变量-Cat1,具有2个级别(0,1) 2.连续Var-Con1 3.分类变量-2级Cat2(0,1) 建模后: 假设所有都是有效的,系数如下所示, Cat1-(-0.6) Con1-(0.3) Cat2-(-0.4)

但当我计算Cat1上事件E的发生率时,我发现Cat1为1时,事件E的发生率很高,我认为这是违反直觉的


请帮助理解这一点。

逻辑回归系数与事件概率的变化不直接相关,而是事件概率变化的相对度量。详细推导了如何解释logistic回归系数。在你的上下文中,CAT1的系数是-0.6意味着p(E | CAT1=1) 截距值是多少?如果它足够高,β系数-0.6仍然可能导致高概率的发生。它是-1.2,截距也是负的,那么它是否进一步加深了分类变量的负性?感谢参考,我现在所理解的已经得到了很好的证明