R中的函数，以聚集表列中的条目_R_Read.table

R中的函数，以聚集表列中的条目

R中的函数，以聚集表列中的条目,r,read.table,R,Read.table,我在R中有这样的输入： > table2[2] Describe.the.color.shown.in.the.image.below. 1 soft crimson 2 dark pink 3 watermelon 4

我在R中有这样的输入：

> table2[2]
   Describe.the.color.shown.in.the.image.below.
1                                  soft crimson
2                                     dark pink
3                                    watermelon
4                                     Light Red
5                                    dark coral
6                                          Rose
7                                         peach
8                               strawberry pink
9                                     light red
10                                         pink
11                                    light red
12                                       salmon
13                                    light red
14                                    light red
15                                         pink
16                                         pink
17                        light and unclear red
18                                   velvet red
19                                    light red
20                                       orange
21                                    light red
22                                   light  red
23                                    light red
24                                    dark pink
25                                   red orange
26                                         pink

我需要做的是，例如：

light red = 8/26
pink = 4/26
orange = 1/26
salmon = 1/26
rose = 1/26

也就是说，我想自动做一个完整的描述

表[2]

，这意味着对颜色进行聚类或简单地计数

有什么想法吗？非常感谢您的示例数据显示每个条目之间的空格不相等，并且您有

浅红色

、

浅红色

等。如果您的实际数据集没有空格问题，您不需要

清理

或

stru trim

 table1 <- structure(list(val = 1:26, V1 = c("soft crimson", "dark pink", 
 "watermelon", "Light Red", "dark coral", "Rose", "peach", "strawberry pink", 
 "light red", "pink", "light red", "salmon", "light red", "light red", 
 "pink", "pink", "light and unclear red", "velvet red", "light red", 
 "orange", "light red", "light  red", "light red", "dark pink", 
 "red orange", "pink")), .Names = c("val", "V1"), row.names = c(NA, 
 -26L), class = "data.frame")



 library(qdap)
 library(stringr)


 100*round(prop.table(table(clean(str_trim(toupper(table1[,2]))))),2) #in the above dataset, `str_trim` is not needed though

    #   DARK CORAL             DARK PINK LIGHT AND UNCLEAR RED 
    #            4                     8                     4 
    #    LIGHT RED                ORANGE                 PEACH 
    #           35                     4                     4 
    #          PINK            RED ORANGE                  ROSE 
    #          15                     4                     4 
    #       SALMON          SOFT CRIMSON       STRAWBERRY PINK 
    #            4                     4                     4 
    #    VELVET RED            WATERMELON 
    #             4                     4

table1你想把“浅红色”和“浅红色”归为一类吗？@akrun这是个好问题。是的，老实说，我想我会的。@Pascal这真的重要吗？我在向你展示我实际使用的是什么。如果它是一个内置函数，是的。你是说table
你是说table[2]
？@Enkei，不是，我是说table（）
函数。假设表[2]是一个向量，lines1
是数据集，那么您在哪里设置要迭代的对象？当我的文本被分配到表[2]时，我应该如何处理readLines（textConnection（“…”）
？我不能只是复制并粘贴文本到其中。@EnKei，你提供了一个我使用读线
阅读的表单示例。其他人仍然不清楚表[2]
是什么。它是data.frame列
？请使用dput
显示数据，以帮助我们帮助你。