R 获得每个班级的前80个百分位数
我试图在R中编写一行程序,在数据帧中查找每个类中的顶级记录。我发现使用R 获得每个班级的前80个百分位数,r,class,sorting,data.table,percentile,R,Class,Sorting,Data.table,Percentile,我试图在R中编写一行程序,在数据帧中查找每个类中的顶级记录。我发现使用mtcars()来处理这种情况是很有可能的 我将继续使用相同的示例,其中我的类是“cyl”,我正在尝试获取列“hp”的顶部值 上一个问题的答案通过头/尾函数给出了“前N个值” require(data.table) d <- data.table(mtcars, key="cyl") d[, head(.SD, 3), by=cyl] require(data.table) 我认为OP可能意味着前80%的记录(对比0.
mtcars()
来处理这种情况是很有可能的
我将继续使用相同的示例,其中我的类是“cyl”
,我正在尝试获取列“hp”
的顶部值
上一个问题的答案通过头/尾函数给出了“前N个值”
require(data.table)
d <- data.table(mtcars, key="cyl")
d[, head(.SD, 3), by=cyl]
require(data.table)
我认为OP可能意味着前80%的记录(对比0.2,而不是0.8)啊道歉。在这种情况下,只需将0.8替换为0.2即可解决此问题。:)谢谢你们。我将尽快对我的真实数据集进行测试,并在获得批准后打勾。
d <- d[order(cyl,-hp)]
d[,.SD[hp >= quantile(hp, 0.8)], by = cyl]
cyl mpg disp hp drat wt qsec vs am gear carb
1: 4 30.4 95.1 113 3.77 1.513 16.90 1 1 5 2
2: 4 21.4 121.0 109 4.11 2.780 18.60 1 1 4 2
3: 4 21.5 120.1 97 3.70 2.465 20.01 1 0 3 1
4: 6 19.7 145.0 175 3.62 2.770 15.50 0 1 5 6
5: 6 19.2 167.6 123 3.92 3.440 18.30 1 0 4 4
6: 6 17.8 167.6 123 3.92 3.440 18.90 1 0 4 4
7: 8 15.0 301.0 335 3.54 3.570 14.60 0 1 5 8
8: 8 15.8 351.0 264 4.22 3.170 14.50 0 1 5 4
9: 8 14.3 360.0 245 3.21 3.570 15.84 0 0 3 4
10: 8 13.3 350.0 245 3.73 3.840 15.41 0 0 3 4
library(dplyr)
d %>%
group_by(cyl) %>%
filter(hp >= quantile(hp, 0.8))