R组合两个数据帧,删除唯一的患者ID

R组合两个数据帧,删除唯一的患者ID,r,R,我有两个数据集:OriginalPTs和resetpts。每个都有三列:PID、Speed和Group。组为“原始”或“重新测试”,具体取决于哪个数据帧。RETENTPTS$PID的所有值都在OriginalPTs$PID中,但OriginalPTs$PID包含我不想使用的其他条目 我想创建一个新的数据帧,它由PID、Speed和Group组成,但只针对在两个原始数据帧中都可以找到的PID。一般来说,我对R和编码都很陌生,所以如果有任何帮助,我将不胜感激。谢谢 head(OriginalPTs)

我有两个数据集:OriginalPTs和resetpts。每个都有三列:PID、Speed和Group。组为“原始”或“重新测试”,具体取决于哪个数据帧。RETENTPTS$PID的所有值都在OriginalPTs$PID中,但OriginalPTs$PID包含我不想使用的其他条目


我想创建一个新的数据帧,它由PID、Speed和Group组成,但只针对在两个原始数据帧中都可以找到的PID。一般来说,我对R和编码都很陌生,所以如果有任何帮助,我将不胜感激。谢谢

head(OriginalPTs): 
  pid    speed    group
1 ALFE 1.418733 Original
2 ALFE 1.187550 Original
3 ALFE 0.536114 Original
4 ALFE 1.350950 Original
5 ALFE 1.505700 Original
6 ALFE 1.907850 Original
每个PID有多个条目

我尝试的是:

left_join(OriginalPts,RetestPTs)
这将生成垂直连接而不是水平连接

我希望看到这两个数据帧并排出现。我还为每一个都提供了一个试用号,如果这样做更容易的话

这有用吗

library(dplyr)
inner_join(OriginalPTs, RetestPTs, by = c("pid")

嗨,布伦南,欢迎来到SO。你能提供一个最小的可重复的例子和你到目前为止得到的代码吗?这会让你的问题更容易回答。尽管如此,听起来您似乎只需要使用正确的
join
函数就可以了。“在两个原始数据帧中都找到”听起来像是调用了
内部连接。感谢您的响应。这给了我一个错误:错误:
by
不能包含LHS中缺少的联接列
PID
。看起来您的df使用小写
PID
library(dplyr)
inner_join(OriginalPTs, RetestPTs, by = c("pid")