以下数据集的R代码是什么_R_Dataset

以下数据集的R代码是什么

以下数据集的R代码是什么,r,dataset,R,Dataset,我有一个数据集，其中有产品及其销售数量。我想写一个R代码，告诉我最畅销的产品 Products Quantity Laminated 520 Laminated 150 Laminated 639 Laminated 702 SUPERSTAR 3 TAMAX 500 TAMAX

我有一个数据集，其中有产品及其销售数量。我想写一个R代码，告诉我最畅销的产品

Products              Quantity

Laminated               520
Laminated               150
Laminated               639
Laminated               702
SUPERSTAR                 3
TAMAX                   500
TAMAX                    20
TAMAX                    40
GreenDragon              40
GreenDragon              50
XPLODE                   40
XPLODE                   20
EXPERT                   40
KHANJARBIOSL             40

在这里，只要看看数据集，我们就可以说，就销售数量而言，层压是最好的产品。我们能为这个写一个R代码吗

谢谢

有多种方法可以做到这一点。使用

tapply

的一种方法是为每个

产品

获取

数量

的

和

，获取最大值的名称

names(which.max(tapply(df$Quantity, df$Products, sum, na.rm  = TRUE)))
#[1] "Laminated"

您可以使用data.table包。首先求和，然后根据聚合值按降序排序。然后取第一行

tb = data.frame("Products" =c("Laminated", "Laminated", "Laminated", "Laminated", "SUPERSTAR", "TAMAX", "TAMAX", "TAMAX", "GreenDragon", "GreenDragon", "XPLODE", "XPLODE", "EXPERT", "KHANJARBIOSL"), "Quantity" = c(520,150,639,702,3,500,20,40,40,50,40,20,40,40))


library(data.table)

tb = data.table(tb)

tb[,sum(Quantity), by="Products"][order(-V1)][1]

从数量上定义“最佳”sold@barbarian我不知道你在做什么，但我想你正在寻找

table（）

。我有一个包含300多种独特产品的大数据集，我的目标是找到数量最多的产品。谢谢。还有一种方法，我可以根据销售的产品数量对数据集进行排序。第一个是层压，第二个是Tamax，第三个是Greendagrong是的，您可以进行名称排序（排序（tapply（df$Quantity，df$Products，sum，na.rm=TRUE），递减=TRUE））