以下数据集的R代码是什么
我有一个数据集,其中有产品及其销售数量。我想写一个R代码,告诉我最畅销的产品以下数据集的R代码是什么,r,dataset,R,Dataset,我有一个数据集,其中有产品及其销售数量。我想写一个R代码,告诉我最畅销的产品 Products Quantity Laminated 520 Laminated 150 Laminated 639 Laminated 702 SUPERSTAR 3 TAMAX 500 TAMAX
Products Quantity
Laminated 520
Laminated 150
Laminated 639
Laminated 702
SUPERSTAR 3
TAMAX 500
TAMAX 20
TAMAX 40
GreenDragon 40
GreenDragon 50
XPLODE 40
XPLODE 20
EXPERT 40
KHANJARBIOSL 40
在这里,只要看看数据集,我们就可以说,就销售数量而言,层压是最好的产品。我们能为这个写一个R代码吗
谢谢有多种方法可以做到这一点。使用
tapply
的一种方法是为每个产品
获取数量
的和
,获取最大值的名称
names(which.max(tapply(df$Quantity, df$Products, sum, na.rm = TRUE)))
#[1] "Laminated"
您可以使用data.table包。首先求和,然后根据聚合值按降序排序。然后取第一行
tb = data.frame("Products" =c("Laminated", "Laminated", "Laminated", "Laminated", "SUPERSTAR", "TAMAX", "TAMAX", "TAMAX", "GreenDragon", "GreenDragon", "XPLODE", "XPLODE", "EXPERT", "KHANJARBIOSL"), "Quantity" = c(520,150,639,702,3,500,20,40,40,50,40,20,40,40))
library(data.table)
tb = data.table(tb)
tb[,sum(Quantity), by="Products"][order(-V1)][1]
从数量上定义“最佳”sold@barbarian我不知道你在做什么,但我想你正在寻找
table()
。我有一个包含300多种独特产品的大数据集,我的目标是找到数量最多的产品。谢谢。还有一种方法,我可以根据销售的产品数量对数据集进行排序。第一个是层压,第二个是Tamax,第三个是Greendagrong是的,您可以进行名称排序(排序(tapply(df$Quantity,df$Products,sum,na.rm=TRUE),递减=TRUE))