R 互斥二进制变量_R_Binary Data

R 互斥二进制变量

R 互斥二进制变量,r,binary-data,R,Binary Data,我目前正在使用bayesglm、朴素贝叶斯和贝叶斯网络建模构建预测模型。我的数据集由互斥的二进制变量组成，其中1表示存在，0表示不存在。如果存在一个变量，则意味着缺少其他变量，因为它们是互斥的。例如，我使用的是政治暴力数据，因此，当试图预测对警察目标的袭击时，模型如下： bayesglm(PoliceTarget ~ ProvinceA, ProvinceB, ProvinceC, BombAttack, ArmedAssault, Assassination, GroupA, GroupB,

我目前正在使用bayesglm、朴素贝叶斯和贝叶斯网络建模构建预测模型。我的数据集由互斥的二进制变量组成，其中1表示存在，0表示不存在。如果存在一个变量，则意味着缺少其他变量，因为它们是互斥的。例如，我使用的是政治暴力数据，因此，当试图预测对警察目标的袭击时，模型如下：

bayesglm(PoliceTarget ~ ProvinceA, ProvinceB, ProvinceC, BombAttack, ArmedAssault, Assassination, GroupA, GroupB, GroupC)

我想知道在模型中使用这种格式的变量是否有问题？我是否应该将这些二进制变量分为省、攻击类型和组，以便它们都包含适当的级别。然后，模型将显示：

bayesglm(PoliceTarget ~ Province, Attacktype, Group)

我应该使用哪种模型构造格式？

错误，应该是

polictarget~Province+Attacktype+Group

。另见第11.1节定义统计模型；安装R时附带的R-intro.pdf的公式。是的，您是正确的。我可以在这样的模型中使用互斥的二进制变量吗？这是不正确的吗？是的，可以。只要响应是二元的，回归系数就可以是二元的，有几个层次的因子，或者是连续的。好的，谢谢。再次检查：我可以在这个模型中使用互斥的二进制变量作为回归器吗？与非互斥二进制变量相反。如果特定二元变量的存在（由1而非零表示）相互排除了另一个二元变量的存在（例如，同一政治暴力袭击不可能在两个不同的省份同时发生），那么包含这些变量是否会导致模型的预测输出变得可疑？谢谢