处理geepackr中的缺失值

处理geepackr中的缺失值,r,missing-data,R,Missing Data,我有一个纵向数据集,其中包括前往诊所接受结核病治疗的受试者。在每次就诊时,都会记录几个潜在的预测因素,并且每次就诊都会有一个二元结果,无论结果是有利的还是不利的 一些预测因子在某些就诊时数据缺失,而在同一就诊时,其他预测因子在该就诊时数据完整 当我在R中使用geepack包运行gee模型时,它给了我一个错误,我发现是丢失的数据导致了错误,因为gee处理的是完整的数据 然而,如果我删除了一个观测值,因为其中一个预测值丢失,而其他预测值则已完成,那么我将丢弃大量数据。有解决办法吗 如果你必须有完整的

我有一个纵向数据集,其中包括前往诊所接受结核病治疗的受试者。在每次就诊时,都会记录几个潜在的预测因素,并且每次就诊都会有一个二元结果,无论结果是有利的还是不利的

一些预测因子在某些就诊时数据缺失,而在同一就诊时,其他预测因子在该就诊时数据完整

当我在R中使用geepack包运行gee模型时,它给了我一个错误,我发现是丢失的数据导致了错误,因为gee处理的是完整的数据

然而,如果我删除了一个观测值,因为其中一个预测值丢失,而其他预测值则已完成,那么我将丢弃大量数据。有解决办法吗

如果你必须有完整的数据,你可以尝试输入它。一个流行的库/方法是“mice”

不过,您必须非常小心地使用这种方法,因为制作数据是一件非常重要的事情。特别是,现实世界中的东西经常丢失,而不是随机丢失。也许极值更可能丢失,或者更可能被记录。我的印象是,如何做到这一点仍然是一个开放的研究问题


也许可以查看此处的教程或其链接的简化版本,看看这是否适用于您的案例,YMMV。

您的问题太广泛了。请点击此处查看如何提出好问题:stackoverflow.com/help/how-to-ask