Python Patsy公式中的多个分类变量
我有一些数据,有多个分类元素 我想用回归法对它们进行建模,使用patsy公式与statsmodels一起使用,以方便使用 当只使用一个分类变量时,如公式Python Patsy公式中的多个分类变量,python,r,statsmodels,patsy,Python,R,Statsmodels,Patsy,我有一些数据,有多个分类元素 我想用回归法对它们进行建模,使用patsy公式与statsmodels一起使用,以方便使用 当只使用一个分类变量时,如公式'C(工作日,治疗)-1'中所示,它会按预期工作,删除截距,并在每个类别的设计矩阵中留下一列 然而,当使用两个不同的分类变量时,例如'C(Status,Treatment)+C(Weekday,Treatment)-1',那么结果矩阵确实没有截距,但是“Weekday”的一个值丢失了,就好像我没有-1'd一样 是否有一些统计上的原因我没有看到?删
'C(工作日,治疗)-1'
中所示,它会按预期工作,删除截距,并在每个类别的设计矩阵中留下一列
然而,当使用两个不同的分类变量时,例如'C(Status,Treatment)+C(Weekday,Treatment)-1'
,那么结果矩阵确实没有截距,但是“Weekday”的一个值丢失了,就好像我没有-1
'd一样
是否有一些统计上的原因我没有看到?删除截距不足以阻止完美共线吗?
谢谢您是否正在寻找使用R编程语言的解决方案?不,我添加了R标记,因为据我所知,patsy公式系统只是R如何实现它的一个重新实现,是不是不正确?老实说,我不熟悉patsy公式,但我理解您为什么要包含它。谢谢