从r中的数据文件列中提取最频繁出现的元素

从r中的数据文件列中提取最频繁出现的元素,r,subset,data-extraction,frequency-analysis,R,Subset,Data Extraction,Frequency Analysis,我有一个大的数据集,我需要从中生成特定的图表。这是我的分析设备生成的数字的一个数据集。我目前正在编写一个能够自动分析这些数据集的函数,为此,我可以使用数据集中名为“Labels”的列 当我使用table()函数时,我得到了“标签”列的内容和频率,我得到了以下信息: > table(datafile$Label) Blank C1 C2 C3a C3b C3c C4 DI E1 E2 E3 High Lo

我有一个大的数据集,我需要从中生成特定的图表。这是我的分析设备生成的数字的一个数据集。我目前正在编写一个能够自动分析这些数据集的函数,为此,我可以使用数据集中名为“Labels”的列

当我使用
table()
函数时,我得到了“标签”列的内容和频率,我得到了以下信息:

> table(datafile$Label)

 Blank     C1     C2    C3a    C3b    C3c     C4     DI     E1     E2     E3   High    Low Medium    Mid 
    11      9      9      9      9      9      9      3      9      9      9      3      3      3     13 
     P    pH3    pH5    pH7    pH9   test   Test 
     9      5      5      5      5      2      1 
我想做的是创建一个向量,我也将其称为“标签”,它只包含出现频率为5或更多的标签

然后,我考虑使用1到“标签”长度的for循环,并使用规则
datafile$Labels==Labels[n]
(其中
n=1:length(Labels)
)来为每个感兴趣的标签创建图表

是否有一个特定的函数可以从列中提取元素,在该列中,条件可以设置为它们出现五次或更多次?因此,从我的示例中,我的新“标签”向量如下所示:

> Labels

[1]    "Blank" "C1" "C2" "C3a" "C3b" "C3c" "C4" "E1" "E2" "E3" "P" "pH3" "pH5" "pH7" "pH9"
我们将衷心接受所有建议


谢谢。

我们可以使用逻辑条件将
子集,并获得
名称

tbl <- table(dataFile$Label)
names(tbl)[tbl > 5]
tbl 5]
If
tbl 5]