Dataframe Julia中的伪变量

Dataframe Julia中的伪变量,dataframe,julia,glm,Dataframe,Julia,Glm,在R中,有一个很好的功能,可以为分类变量的每个级别运行带有虚拟变量的回归。e、 g 在朱莉娅身上也有类似的方法吗 x = randn(1000) group = repmat(1:25 , 40) groupMeans = randn(25) y = 3*x + groupMeans[group] data = DataFrame(x=x, y=y, g=group) for i in levels(group) data[parse("I$i")] = data[:g] .== i

在R中,有一个很好的功能,可以为分类变量的每个级别运行带有虚拟变量的回归。e、 g

在朱莉娅身上也有类似的方法吗

x = randn(1000)
group = repmat(1:25 , 40)
groupMeans = randn(25)
y = 3*x + groupMeans[group]

data = DataFrame(x=x, y=y, g=group)
for i in levels(group)
    data[parse("I$i")] = data[:g] .== i
end
lm(y~x+I1+I2+I3+I4+I5+I6+I7+I8+I9+I10+
    I11+I12+I13+I14+I15+I16+I17+I18+I19+I20+
    I21+I22+I23+I24, data)

如果您使用的是DataFrames软件包,则在
汇集数据后,软件包将处理其余数据:

池列对于使用GLM包很重要拟合回归模型时,输入中的PooledDataArray列将转换为ModelMatrix中的0/1指标列,其中PooledDataArray的每个级别对应一列


您可以看到关于池数据的其余文档

btw,池数据框架需要发生什么:
pool!(数据,[:g]);lm(y~x+g,数据)
我认为上述答案可能过时了。方法是使用“对比”显示的<代码>lm(@formula(y~x),数据,对比度=Dict(:x=>DummyCoding())