R 互斥二进制变量

R 互斥二进制变量,r,binary-data,R,Binary Data,我目前正在使用bayesglm、朴素贝叶斯和贝叶斯网络建模构建预测模型。我的数据集由互斥的二进制变量组成,其中1表示存在,0表示不存在。如果存在一个变量,则意味着缺少其他变量,因为它们是互斥的。例如,我使用的是政治暴力数据,因此,当试图预测对警察目标的袭击时,模型如下: bayesglm(PoliceTarget ~ ProvinceA, ProvinceB, ProvinceC, BombAttack, ArmedAssault, Assassination, GroupA, GroupB,

我目前正在使用bayesglm、朴素贝叶斯和贝叶斯网络建模构建预测模型。我的数据集由互斥的二进制变量组成,其中1表示存在,0表示不存在。如果存在一个变量,则意味着缺少其他变量,因为它们是互斥的。例如,我使用的是政治暴力数据,因此,当试图预测对警察目标的袭击时,模型如下:

bayesglm(PoliceTarget ~ ProvinceA, ProvinceB, ProvinceC, BombAttack, ArmedAssault, Assassination, GroupA, GroupB, GroupC) 
我想知道在模型中使用这种格式的变量是否有问题?我是否应该将这些二进制变量分为省、攻击类型和组,以便它们都包含适当的级别。然后,模型将显示:

bayesglm(PoliceTarget ~ Province, Attacktype, Group) 

我应该使用哪种模型构造格式?

错误,应该是
polictarget~Province+Attacktype+Group
。另见第11.1节定义统计模型;安装R时附带的R-intro.pdf的公式。是的,您是正确的。我可以在这样的模型中使用互斥的二进制变量吗?这是不正确的吗?是的,可以。只要响应是二元的,回归系数就可以是二元的,有几个层次的因子,或者是连续的。好的,谢谢。再次检查:我可以在这个模型中使用互斥的二进制变量作为回归器吗?与非互斥二进制变量相反。如果特定二元变量的存在(由1而非零表示)相互排除了另一个二元变量的存在(例如,同一政治暴力袭击不可能在两个不同的省份同时发生),那么包含这些变量是否会导致模型的预测输出变得可疑?谢谢