Dataframe Julia中的伪变量_Dataframe_Julia_Glm

Dataframe Julia中的伪变量

dataframe julia

Dataframe Julia中的伪变量,dataframe,julia,glm,Dataframe,Julia,Glm,在R中，有一个很好的功能，可以为分类变量的每个级别运行带有虚拟变量的回归。e、 g 在朱莉娅身上也有类似的方法吗 x = randn(1000) group = repmat(1:25 , 40) groupMeans = randn(25) y = 3*x + groupMeans[group] data = DataFrame(x=x, y=y, g=group) for i in levels(group) data[parse("I$i")] = data[:g] .== i

在R中，有一个很好的功能，可以为分类变量的每个级别运行带有虚拟变量的回归。e、 g

在朱莉娅身上也有类似的方法吗

x = randn(1000)
group = repmat(1:25 , 40)
groupMeans = randn(25)
y = 3*x + groupMeans[group]

data = DataFrame(x=x, y=y, g=group)
for i in levels(group)
    data[parse("I$i")] = data[:g] .== i
end
lm(y~x+I1+I2+I3+I4+I5+I6+I7+I8+I9+I10+
    I11+I12+I13+I14+I15+I16+I17+I18+I19+I20+
    I21+I22+I23+I24, data)

如果您使用的是DataFrames软件包，则在

汇集数据后，软件包将处理其余数据：
池列对于使用GLM包很重要拟合回归模型时，输入中的PooledDataArray列将转换为ModelMatrix中的0/1指标列，其中PooledDataArray的每个级别对应一列
您可以看到关于池数据的其余文档
btw，池数据框架需要发生什么：pool！（数据，[：g]）；lm（y~x+g，数据）
我认为上述答案可能过时了。方法是使用“对比”显示的<代码>lm（@formula（y~x），数据，对比度=Dict（：x=>DummyCoding（））