有没有一种方法可以更有效地将这些多个断点(具有相等的步长)写入R函数cut?
这就是我所做的,它给出了我想要的结果,但效率很低有没有一种方法可以更有效地将这些多个断点(具有相等的步长)写入R函数cut?,r,label,cut,R,Label,Cut,这就是我所做的,它给出了我想要的结果,但效率很低 cut(df1$wage, breaks = c(-Inf, 20000,21000,22000,23000,24000,25000,26000,27000,28000,29000,30000, Inf), include.lowest=TRUE, dig.lab=10, labels = c("-20 000", "20 000-21 000", "21 000-22 000", "22 000-23 000", "23 0
cut(df1$wage, breaks = c(-Inf, 20000,21000,22000,23000,24000,25000,26000,27000,28000,29000,30000, Inf),
include.lowest=TRUE, dig.lab=10, labels = c("-20 000", "20 000-21 000", "21 000-22 000", "22 000-23 000", "23 000-24 000",
"24 000-25 000", "25 000-26 000", "26 000-27 000", "27 000-28 000", "28 000-29 000", "29 000-30 000", "30 000-"))
我想要一个最低的箱子,包括所有的值,直到某个指定的值,在这个例子中是20000。所有值均大于30000
我希望能够改变断点之间的步长,在这个例子中,现在是1000,比如说500,而不必明确指定所有断点
最佳情况下,我还希望标签遵循我指定的断点,否则这也会成为一个非常低效的过程
对于中断部分,我接近于
中断=(seq(from=20000,to=30000,by=1000))
,但不知道如何像上面的例子那样包括底部和顶部的存储箱您可以将中断存储在向量中,并在中断和标签中使用它
breaks <- seq(from = 20000, to = 30000, by = 1000)
cut(df1$wage, breaks = c(-Inf, breaks Inf), include.lowest=TRUE, dig.lab=10,
labels = c(-20000, paste(head(breaks, -1), tail(breaks, -1), sep = "-"), "30000-"))
中断