当我运行分位数回归时,为什么R从因子变量中删除因子?
我目前正在使用Roger Koenker的当我运行分位数回归时,为什么R从因子变量中删除因子?,r,categorical-data,quantile,quantreg,R,Categorical Data,Quantile,Quantreg,我目前正在使用Roger Koenker的quantreg软件包运行R中的分位数回归模型。我有一个有序的分类变量,有五个级别和三个无序的分类变量(一周中的一天、一个季节以及是否是夜间),分别有七个、四个和两个类别。除了有序分类变量(从1到5的五个级别)之外,所有变量最初都作为字符串存储在数据帧中。以下是我如何将前面提到的变量编码为因子。请注意,我的变量名为df_prime,因为它是原始数据帧,带有一些修剪过的行: df_prime$acuity_id <- ordered(df_prime
quantreg
软件包运行R中的分位数回归模型。我有一个有序的分类变量,有五个级别和三个无序的分类变量(一周中的一天、一个季节以及是否是夜间),分别有七个、四个和两个类别。除了有序分类变量(从1到5的五个级别)之外,所有变量最初都作为字符串存储在数据帧中。以下是我如何将前面提到的变量编码为因子。请注意,我的变量名为df_prime
,因为它是原始数据帧,带有一些修剪过的行:
df_prime$acuity_id <- ordered(df_prime$acuity_id, c(5, 4, 3, 2, 1))
df_prime$day_of_week <- as.factor(df_prime$day_of_week)
df_prime$season <- as.factor(df_prime$season)
df_prime$is_night <- as.factor(df_prime$is_night)
与治疗相比,一个因子水平(与其他水平相比)由截距表示。谢谢!那么周五的“缺失”信息和缺失的敏锐度水平被纳入截距?另外,.L、.Q和.C代表什么样的视力水平?我假设^4表示四次方。你需要研究什么是治疗对比和多项式对比。@Roland谢谢!我只是在维基百科的页面上查到了对比,它们确实使用了手段。对于像我正在处理的那种高度倾斜的数据(它不受日志的影响),这会是一个问题吗?这就是我开始使用分位数回归的原因。有没有办法根据分位数进行对比?
Value Std. Error t value Pr(>|t|)
(Intercept) 173.20000 5.84510 29.63167 0.00000
day_of_weekMonday 19.33333 3.60107 5.36878 0.00000
day_of_weekSaturday -49.66667 3.41145 -14.55883 0.00000
day_of_weekSunday -42.00000 3.35297 -12.52620 0.00000
day_of_weekThursday 5.33333 3.51831 1.51588 0.12957
day_of_weekTuesday 3.00000 3.51917 0.85247 0.39396
day_of_weekWednesday 1.66667 3.75717 0.44360 0.65734
is_night1 -53.00000 2.04268 -25.94626 0.00000
seasonAutumn 8.00000 4.37771 1.82744 0.06765
seasonSpring -0.66667 4.46209 -0.14941 0.88123
seasonSummer 12.66667 4.40002 2.87877 0.00400
seasonWinter 0.00000 4.36418 0.00000 1.00000
acuity_id.L 37.94733 11.20886 3.38548 0.00071
acuity_id.Q -108.68624 9.48982 -11.45293 0.00000
acuity_id.C -36.36619 5.93905 -6.12324 0.00000
acuity_id^4 25.61773 2.77411 9.23459 0.00000