R:如何根据另一个变量发现的频率创建组?
我有一个R:如何根据另一个变量发现的频率创建组?,r,R,我有一个数据集,其中大约有300个不同的类别代码(X2),每个类别代码都与一个数字(X1)关联,这些数字经常在不同的类别代码上重复,反之亦然: X1 X2 1923 AA12 1923 AA28 1923 AA23 1348 AA12 1348 AB17 1348 AB08 9334 AA12 9334 AD02 等等 我想知道如何创建不同的类别代码组或桶,这些类别代码通常基于X1变量一起找到。我想不出一个简单的方法 有什么想法吗 谢谢 我不确定您希望使
数据集
,其中大约有300个不同的类别代码(X2
),每个类别代码都与一个数字(X1
)关联,这些数字经常在不同的类别代码上重复,反之亦然:
X1 X2
1923 AA12
1923 AA28
1923 AA23
1348 AA12
1348 AB17
1348 AB08
9334 AA12
9334 AD02
等等
我想知道如何创建不同的类别代码组或桶,这些类别代码通常基于X1
变量一起找到。我想不出一个简单的方法
有什么想法吗
谢谢 我不确定您希望使用什么格式,但我只想将X1和X2列粘贴在一起,然后使用
table
给出频率计数。如果您想查看最常见的,只需使用sort
功能对其进行排序
假设您的数据位于名为df
sort(table(paste0(df$X1, "_", df$X2)))
如果您打算在原始数据框中给出标签,以确定它们是否经常一起出现,请提供更多信息。因为没有一致的方法来识别“最常在一起”除非你字面上的意思是你只想把频率最高的分类