Merge SPSS-合并ID变量重复案例和新案例/变量的文件
我有一个多年来商店访问的管理数据集,我正试图将它合并到Merge SPSS-合并ID变量重复案例和新案例/变量的文件,merge,duplicates,spss,Merge,Duplicates,Spss,我有一个多年来商店访问的管理数据集,我正试图将它合并到ID变量下的一个数据集中 每个数据集都有一个重复的ID,在不同的商店访问期间出现,并由Date注释。一些较新的数据文件还包含旧数据文件中未包含的新变量(Y)。不同年份的数据集还将包含由不同的ID指示的不同案例。此外,有些变量可能在不同的日期对每种情况都是相同的。我希望合并的文件保留这些副本 示例数据文件: 文件1 ID Date X 1 3 4 1 5 3 2 1 4 文件2 ID Date X Y 1 6
ID
变量下的一个数据集中
每个数据集都有一个重复的ID
,在不同的商店访问期间出现,并由Date
注释。一些较新的数据文件还包含旧数据文件中未包含的新变量(Y
)。不同年份的数据集还将包含由不同的ID
指示的不同案例。此外,有些变量可能在不同的日期对每种情况都是相同的。我希望合并的文件保留这些副本
示例数据文件:
文件1
ID Date X
1 3 4
1 5 3
2 1 4
文件2
ID Date X Y
1 6 4 2
1 7 1 5
2 8 4 7
3 7 2 3
我希望合并的文件继续列出所有重复的案例,例如:
ID Date X Y
1 3 4 .
1 5 3 .
1 6 4 2
1 7 1 5
2 1 4 .
2 8 4 7
3 7 2 3
然后我计划重新构造(CASESTOVARS/AUTOFIX=0
)合并的文件,使其看起来像这样:
ID Date.1 Date.2 Date.3 Date.4 X.1 X.2 X.3 X.4 Y.1 Y.2 Y.3 Y.4
1 3 5 6 7 4 3 4 1 . . 2 5
2 1 8 . . 4 4 . . . 7 . .
3 7 . . . 2 . . . 3 . . .
然而,我在最初的合并过程中遇到了麻烦。我曾尝试寻找最安全的方式来合并文件,当它们都有重复的情况下,以确保没有数据丢失的过程中。“添加变量”方法似乎会导致重复变量的值丢失
谢谢
编辑:如果我使用“添加变量”功能,同时使用
ID
和Date
变量作为关键变量,这是否有助于避免删除重复的案例?为什么不尝试添加案例
而不是添加变量
?如果没有出现相同日期的相同Id,则可以使用casestovars
如果存在这种情况,您需要先考虑如何处理它们,然后才能继续执行casestovars
一种方法是按ID和日期进行聚合,然后决定是否要添加此案例的数据变量。我将尝试一下。如果存在“未配对”变量(例如,将旧数据集添加到具有新变量的新数据集时),如果我将它们移到活动数据集中,合并数据集中的旧案例是否会被标记为“缺少”?好的,因此使用“添加案例”命令可以很好地处理子文件。当我尝试重组/转换时,我遇到了一些问题。实际上,每次访问都有三个标识符:“ID”(每个人);”日期';和“Recrdnum”(记录特定就诊的号码,如果同一个人在同一日期多次就诊,则号码会有所不同)。如何将这些输入到重构语法中,以相应地转置(“CASESTOVARS”)数据?在
CASESTOVARS
中可以有多个索引变量。但我认为你的重组问题需要更多的阐述,所以也许可以在一个单独的问题中关注它。