以下数据集的R代码是什么

以下数据集的R代码是什么,r,dataset,R,Dataset,我有一个数据集,其中有产品及其销售数量。我想写一个R代码,告诉我最畅销的产品 Products Quantity Laminated 520 Laminated 150 Laminated 639 Laminated 702 SUPERSTAR 3 TAMAX 500 TAMAX

我有一个数据集,其中有产品及其销售数量。我想写一个R代码,告诉我最畅销的产品

Products              Quantity

Laminated               520
Laminated               150
Laminated               639
Laminated               702
SUPERSTAR                 3
TAMAX                   500
TAMAX                    20
TAMAX                    40
GreenDragon              40
GreenDragon              50
XPLODE                   40
XPLODE                   20
EXPERT                   40
KHANJARBIOSL             40
在这里,只要看看数据集,我们就可以说,就销售数量而言,层压是最好的产品。我们能为这个写一个R代码吗


谢谢

有多种方法可以做到这一点。使用
tapply
的一种方法是为每个
产品
获取
数量
,获取最大值的名称

names(which.max(tapply(df$Quantity, df$Products, sum, na.rm  = TRUE)))
#[1] "Laminated"

您可以使用data.table包。首先求和,然后根据聚合值按降序排序。然后取第一行

tb = data.frame("Products" =c("Laminated", "Laminated", "Laminated", "Laminated", "SUPERSTAR", "TAMAX", "TAMAX", "TAMAX", "GreenDragon", "GreenDragon", "XPLODE", "XPLODE", "EXPERT", "KHANJARBIOSL"), "Quantity" = c(520,150,639,702,3,500,20,40,40,50,40,20,40,40))


library(data.table)

tb = data.table(tb)

tb[,sum(Quantity), by="Products"][order(-V1)][1]

从数量上定义“最佳”sold@barbarian我不知道你在做什么,但我想你正在寻找
table()
。我有一个包含300多种独特产品的大数据集,我的目标是找到数量最多的产品。谢谢。还有一种方法,我可以根据销售的产品数量对数据集进行排序。第一个是层压,第二个是Tamax,第三个是Greendagrong是的,您可以进行名称排序(排序(tapply(df$Quantity,df$Products,sum,na.rm=TRUE),递减=TRUE))