R 当某些值故意未知时,如何在逻辑回归中编码预测值

R 当某些值故意未知时,如何在逻辑回归中编码预测值,r,variables,encoding,logistic-regression,R,Variables,Encoding,Logistic Regression,我决定把我的问题贴在这里,因为严格来说,它与编码有关 问题如下。在一个涉及两种情况的心理实验中,一个由数值组成的自变量出现在一种情况下,而在另一种情况下则不存在。因此,在一种情况下,点内变量提供了相关信息,范围在0到20之间。在另一种情况下,参与者根本没有获得此类信息 将数据绑定在一起,在第二种情况下——参与者没有获得此类信息——我将变量编码为NA。但是,当我运行逻辑模型时,设置na.action=na.omit会导致模型失败 原则上,我的数据中的NAs不是缺失值,但根据实验设计,我希望反映在某

我决定把我的问题贴在这里,因为严格来说,它与编码有关

问题如下。在一个涉及两种情况的心理实验中,一个由数值组成的自变量出现在一种情况下,而在另一种情况下则不存在。因此,在一种情况下,点内变量提供了相关信息,范围在0到20之间。在另一种情况下,参与者根本没有获得此类信息

将数据绑定在一起,在第二种情况下——参与者没有获得此类信息——我将变量编码为NA。但是,当我运行逻辑模型时,设置na.action=na.omit会导致模型失败

原则上,我的数据中的NAs不是缺失值,但根据实验设计,我希望反映在某个条件下缺少该信息

因此,在我看来,多元插补——可以用mice或其他软件包实现——并不是正确的做法。事实上,如果我愿意,我可以简单地检索感兴趣的值,但将它们包含在数据中是不合适的,因为正如前面提到的,参与者被阻止了解其值

是否有任何策略来编码这些未知值并处理此问题


任何帮助都将不胜感激。多谢各位

这不是编程问题,也不应该出现在这个论坛上。但是,我认为1-20案例的答案是:将
NA
s编码为
0
s,并创建一个新的虚拟变量,显示你的
NA
s之前出现过的1。谢谢。如果值在0到20之间呢?仍然将其编码为0-关键是如果值为0,估计量不会改变它,并且效果被虚拟变量的估计量捕获。我得到了它。非常感谢你!