R 如何使用带列范围的方框图

R 如何使用带列范围的方框图,r,boxplot,R,Boxplot,我想为每个收入年度

我想为每个收入
年度
五分位数绘制费用占收入的百分比

这就是我到目前为止所做的:

pacman::p_load(RCurl, plm, tibble, ggplot2, AER, dplyr, car, arm, broom, tidyr, fastDummies, dummies)


x <- getURL("https://raw.githubusercontent.com/dothemathonthatone/maps/master/main_test.csv")
    maindf <- read.csv(text = x, row.names=NULL)

maindf <- maindf %>% 
 mutate(category = cut(year_hh_inc, breaks = (quantile(year_hh_inc, c(0, 1 / 5, 2 / 5, 3 / 5, 4 / 5, 1), na.rm = TRUE)), labels = c("first_quint", "second_quint", "third_quint", 'fourth_quint', 'fifth_quint'), include.lowest = TRUE), vals = 1) %>% 
 pivot_wider(names_from = category, values_from = vals, values_fill = list(vals = 0))


box  <- boxplot(maindf$year_hh_inc ~ maindf$fee_per_inc, col = 3:5)
pacman::p_载荷(RCurl、plm、tibble、ggplot2、AER、dplyr、汽车、手臂、扫帚、tidyr、快速假人、假人)

我想这里有几个问题。您需要使用箱线图将变量反过来。此外,还需要使用在mutate中创建的
类别
变量,而不是原始变量。最后,您不需要更宽的
pivot\u

一些值也远远超出了有用的范围,可能是错误的(一些数字是-8),因此我对异常值进行了修剪,以使图表更漂亮。您需要检查原始数据,看看这是否有意义

pacman::p_载荷(RCurl、plm、tibble、ggplot2、AER、dplyr、汽车、手臂、扫帚、tidyr、快速假人、假人)

x Michael,我得到的
maindf$year\u hh\u inc
是一个有7个级别的因子变量,而不是一个可以
剪切的数值变量<代码>级别:-8 0,70 0,75 0.25 1 f-r_欧元20 f-r_收入
@AllanCameron感谢您关注问题并告知数据问题。我刚刚更新了这个表,在与它争论之后,我在Jupyter笔记本终端上测试了结果。现在看起来不错。