Dataframe 无重复R的测向中的频率
你好,我有df“连衣裙” 我在计算有多少倍的颜色是蓝色的 结果是5件,其中有3件t恤。我只想知道有多少“类型”是蓝色的,所以如果重复“t-shirt”类型,我希望只计算一次。问题是:“在多少种类型中,“蓝色”被重复?”因此,在这个条件下,结果应该是2。我怎么能做到 另外,我想知道一种类型重复了多少次,例如“蓝色t恤重复了3次”之类的信息 df是:Dataframe 无重复R的测向中的频率,dataframe,repeat,frequency,Dataframe,Repeat,Frequency,你好,我有df“连衣裙” 我在计算有多少倍的颜色是蓝色的 结果是5件,其中有3件t恤。我只想知道有多少“类型”是蓝色的,所以如果重复“t-shirt”类型,我希望只计算一次。问题是:“在多少种类型中,“蓝色”被重复?”因此,在这个条件下,结果应该是2。我怎么能做到 另外,我想知道一种类型重复了多少次,例如“蓝色t恤重复了3次”之类的信息 df是: dput(dress) structure(list(type = c("t-shirt", "t-shirt"
dput(dress)
structure(list(type = c("t-shirt", "t-shirt", "jeans", "skirt",
"skirt", "blouse", "jeans", "t-shirt", "skirt", "blouse"), size = c("small",
"medium", "large", "small", "medium", "large", "small", "medium",
"large", "large"), color = c("blue", "blue", "yellow", "pink",
"yellow", "blue", "blue", "blue", "yellow", "pink"), freqBlue = c(5L,
5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L)), row.names = c(NA, -10L), class = "data.frame")
如果我正确理解了你的问题,
dplyr
就是你要找的
dt %>%
group_by(type, color) %>%
summarise(
freq =n()
)
其中,dt
是您的data.frame
,脚本生成以下输出
# A tibble: 7 x 3
# Groups: type [4]
type color freq
<chr> <chr> <int>
1 blouse blue 1
2 blouse pink 1
3 jeans blue 1
4 jeans yellow 1
5 skirt pink 1
6 skirt yellow 2
7 t-shirt blue 3
#一个tible:7 x 3
#分组:类型[4]
类型颜色频率
1件蓝色上衣1件
2件粉色上衣1件
3牛仔裤蓝色1
4牛仔裤黄色1
5件粉红色裙子1件
6裙子黄色2
7件蓝色t恤衫3
此处
n()
按组统计出现次数,您可以继续添加组 这个答案对于第二个问题很有用,但我需要频率而不是重复。问题是:有多少种颜色“蓝色”是重复的?噢!我想我现在明白了。如果您的数据已过账,则您只需删除代码中的类型
;然后,它将统计每个颜色的出现次数,根据定义,这是所有类型
,大小
等的颜色的出现次数。它解决了所有问题吗??
dt %>%
group_by(type, color) %>%
summarise(
freq =n()
)
# A tibble: 7 x 3
# Groups: type [4]
type color freq
<chr> <chr> <int>
1 blouse blue 1
2 blouse pink 1
3 jeans blue 1
4 jeans yellow 1
5 skirt pink 1
6 skirt yellow 2
7 t-shirt blue 3