R：如何根据另一个变量发现的频率创建组？_R

R：如何根据另一个变量发现的频率创建组？

R：如何根据另一个变量发现的频率创建组？,r,R,我有一个数据集，其中大约有300个不同的类别代码（X2），每个类别代码都与一个数字（X1）关联，这些数字经常在不同的类别代码上重复，反之亦然： X1 X2 1923 AA12 1923 AA28 1923 AA23 1348 AA12 1348 AB17 1348 AB08 9334 AA12 9334 AD02 等等我想知道如何创建不同的类别代码组或桶，这些类别代码通常基于X1变量一起找到。我想不出一个简单的方法有什么想法吗谢谢我不确定您希望使

我有一个

数据集

，其中大约有300个不同的类别代码（

X2

），每个类别代码都与一个数字（

X1

）关联，这些数字经常在不同的类别代码上重复，反之亦然：

等等

我想知道如何创建不同的类别代码组或桶，这些类别代码通常基于

X1

变量一起找到。我想不出一个简单的方法

有什么想法吗

谢谢

我不确定您希望使用什么格式，但我只想将X1和X2列粘贴在一起，然后使用

table

给出频率计数。如果您想查看最常见的，只需使用

sort

功能对其进行排序

假设您的数据位于名为

df

sort(table(paste0(df$X1, "_", df$X2)))

如果您打算在原始数据框中给出标签，以确定它们是否经常一起出现，请提供更多信息。因为没有一致的方法来识别“最常在一起”除非你字面上的意思是你只想把频率最高的分类