Statistics 泊松回归与逻辑回归的比较
我有一个关联的二进制结果变量的数据。当然,我运行逻辑回归,以查看参数估计和优势比。不过,我很好奇,将这个数据从二进制结果更改为计数数据。然后我对计数数据进行了泊松回归(和负二项回归) 不过,我不知道如何比较这些不同的模型,我看到的所有比较似乎都只涉及嵌套模型Statistics 泊松回归与逻辑回归的比较,statistics,regression,Statistics,Regression,我有一个关联的二进制结果变量的数据。当然,我运行逻辑回归,以查看参数估计和优势比。不过,我很好奇,将这个数据从二进制结果更改为计数数据。然后我对计数数据进行了泊松回归(和负二项回归) 不过,我不知道如何比较这些不同的模型,我看到的所有比较似乎都只涉及嵌套模型 您将如何决定在这种情况下使用的最佳模型?基本上这两种模型大致相同。真正重要的是你的目标是什么——你真正想要预测的是什么。如果您想确定有多少病例是好的或坏的(1或0),那么您可以进行逻辑回归。如果你真的感兴趣的情况下要做多少(计数),然后做泊
您将如何决定在这种情况下使用的最佳模型?基本上这两种模型大致相同。真正重要的是你的目标是什么——你真正想要预测的是什么。如果您想确定有多少病例是好的或坏的(1或0),那么您可以进行逻辑回归。如果你真的感兴趣的情况下要做多少(计数),然后做泊松 换句话说,这两个模型之间的唯一区别是逻辑转换和逻辑回归试图最小化误分类误差(-2对数似然)的事实。简单地说,即使对二元结果运行线性回归(OLS),除了结果可能不在0和1之间(例如RoC曲线下的区域与逻辑模型相似)之外,您不应该看到与逻辑模型的巨大差异
总之,不要担心这两种模型中哪一种更好,它们在捕获功能信息的方式上应该大致相同。只要想想,优化、计数或概率更有意义。如果你考虑非线性模型(如随机森林或神经网络等),答案可能会有所不同,但你考虑的两个模型都(几乎)是线性的,所以不用担心要考虑的一件事是样品设计。如果您使用的是病例对照研究,那么logistic回归是一种可行的方法,因为它具有logit-link函数,而不是泊松回归中的比率对数。这是因为,在病例对照研究中存在过抽样的情况下,这是无偏见的。这个问题似乎是离题的,因为它是关于统计学的。