R中的函数,以聚集表列中的条目
我在R中有这样的输入:R中的函数,以聚集表列中的条目,r,read.table,R,Read.table,我在R中有这样的输入: > table2[2] Describe.the.color.shown.in.the.image.below. 1 soft crimson 2 dark pink 3 watermelon 4
> table2[2]
Describe.the.color.shown.in.the.image.below.
1 soft crimson
2 dark pink
3 watermelon
4 Light Red
5 dark coral
6 Rose
7 peach
8 strawberry pink
9 light red
10 pink
11 light red
12 salmon
13 light red
14 light red
15 pink
16 pink
17 light and unclear red
18 velvet red
19 light red
20 orange
21 light red
22 light red
23 light red
24 dark pink
25 red orange
26 pink
我需要做的是,例如:
light red = 8/26
pink = 4/26
orange = 1/26
salmon = 1/26
rose = 1/26
也就是说,我想自动做一个完整的描述表[2]
,这意味着对颜色进行聚类或简单地计数
有什么想法吗?非常感谢您的示例数据显示每个条目之间的空格不相等,并且您有
浅红色
、浅红色
等。如果您的实际数据集没有空格问题,您不需要清理
或stru trim
table1 <- structure(list(val = 1:26, V1 = c("soft crimson", "dark pink",
"watermelon", "Light Red", "dark coral", "Rose", "peach", "strawberry pink",
"light red", "pink", "light red", "salmon", "light red", "light red",
"pink", "pink", "light and unclear red", "velvet red", "light red",
"orange", "light red", "light red", "light red", "dark pink",
"red orange", "pink")), .Names = c("val", "V1"), row.names = c(NA,
-26L), class = "data.frame")
library(qdap)
library(stringr)
100*round(prop.table(table(clean(str_trim(toupper(table1[,2]))))),2) #in the above dataset, `str_trim` is not needed though
# DARK CORAL DARK PINK LIGHT AND UNCLEAR RED
# 4 8 4
# LIGHT RED ORANGE PEACH
# 35 4 4
# PINK RED ORANGE ROSE
# 15 4 4
# SALMON SOFT CRIMSON STRAWBERRY PINK
# 4 4 4
# VELVET RED WATERMELON
# 4 4
table1你想把“浅红色”和“浅红色”归为一类吗?@akrun这是个好问题。是的,老实说,我想我会的。@Pascal这真的重要吗?我在向你展示我实际使用的是什么。如果它是一个内置函数,是的。你是说table
你是说table[2]
?@Enkei,不是,我是说table()
函数。假设表[2]是一个向量,lines1
是数据集,那么您在哪里设置要迭代的对象?当我的文本被分配到表[2]时,我应该如何处理readLines(textConnection(“…”)
?我不能只是复制并粘贴文本到其中。@EnKei,你提供了一个我使用读线
阅读的表单示例。其他人仍然不清楚表[2]
是什么。它是data.frame列
?请使用dput
显示数据,以帮助我们帮助你。