通过标志从sas中的多个数据集中查找重复项

通过标志从sas中的多个数据集中查找重复项,sas,duplicates,Sas,Duplicates,我有这样一个数据集: ID Date Flag A 1/1/11 000 A 1/1/11 001 A 1/1/11 010 B 1/2/11 000 B 1/3/11 001 我设置了一个标记来跟踪某些列,并将原始数据集分为四个较小的列。因此,一个用于标志='000',一个用于'001',一个用于'010'和'011'。如果按ID和日期进行唯一计数,则原始数据集的计数为500。但是每一个单独的国旗,如果我把总数加起来,我会得到600。这意味着100条记录是重复的,因此在我上面的

我有这样一个数据集:

ID  Date  Flag
A  1/1/11 000
A  1/1/11 001
A  1/1/11 010
B  1/2/11 000
B  1/3/11 001

我设置了一个标记来跟踪某些列,并将原始数据集分为四个较小的列。因此,一个用于标志='000',一个用于'001',一个用于'010'和'011'。如果按ID和日期进行唯一计数,则原始数据集的计数为500。但是每一个单独的国旗,如果我把总数加起来,我会得到600。这意味着100条记录是重复的,因此在我上面的示例中,1/1/11的A只是一条唯一的记录,但它出现在“000”、“010”、“001”的子数据集中。因此,在额外的100份副本中,3份是日期为2011年1月1日的副本。是否有一种方法可以在不手动查看“按标志显示哪些记录是重复的”的情况下解决此问题?

您希望输出是什么?理想情况下,您尝试获取的任何代码。hm,proc sql-从表中选择distinct id,date,count*应该列出忽略标志时重复的频率,或者您可以使用proc摘要,但我不确定这是否是您想要的。。。