在R中:试图确定数据集中重复ID号的起始位置
提前感谢您抽出时间阅读本文。我刚开始学习R,没有编程背景,因此,即使您可以帮助我为我尝试执行的分析或函数命名,以便我能够有效地查找其他资源,我也将不胜感激: 我想看看从特定地点释放的动物是否已经离开了它们的释放地点。我有4个释放点和超过20个样带。“RECAP1”表示在一个样带上捕获的唯一ID号,该样带对应于一个特定的原产地释放点,“RUW”和“RLW”是两个原产地释放点 下面我提供了我正在使用的集合的一个示例,我在“RECAP1”的第一行使用了一个ID,它与“RUW”的最后一行中的数字相匹配(我第一次使用dput()函数,因此如果我被狠狠地鞭打,我深表歉意): 我想要实现的是一个列表输出,它告诉我重复的ID号来自哪个列(按名称) 这是我正在寻找的输出类型的示例:在R中:试图确定数据集中重复ID号的起始位置,r,reshape,R,Reshape,提前感谢您抽出时间阅读本文。我刚开始学习R,没有编程背景,因此,即使您可以帮助我为我尝试执行的分析或函数命名,以便我能够有效地查找其他资源,我也将不胜感激: 我想看看从特定地点释放的动物是否已经离开了它们的释放地点。我有4个释放点和超过20个样带。“RECAP1”表示在一个样带上捕获的唯一ID号,该样带对应于一个特定的原产地释放点,“RUW”和“RLW”是两个原产地释放点 下面我提供了我正在使用的集合的一个示例,我在“RECAP1”的第一行使用了一个ID,它与“RUW”的最后一行中的数字相匹配(
DETECTION RECAP SITE ORIGIN SITE
1 3D9.1C2DBF8F56 RECAP1 RUW
2 3D9.1C2DBF33H4 RECAP17 RLW
3 3D9.1C2DF4BE93 RECAP6 RLM
我想这就是你想要做的。基本上,对于每个
RECAP1
值,您想知道它是出现在RUW
还是RLW
中
library(reshape2)
df2 <- melt(
df,
id.vars = 'RECAP1'
)
df2[df2$RECAP1 %in% df2$value,1:2]
如果我误解了,请您将您的样本输入和样本输出与您试图完成的确切过程联系起来好吗?您的
recap站点
列值看起来与RECAP1
列不同。这只是为了举例,还是我遗漏了什么?哦,不,对不起,你没有遗漏任何东西,我只做了第二行和第三行作为例子。我有大约20个“RECAPx”站点,有超过600次检测,我只是不确定你们想看到多少数据。每一行到底代表什么?我不太理解这里的ID变量。@iShouldUseAName,在示例输出中:行包含检测到的标识码,该标识码对于从特定位置释放的动物是唯一的。其他值是指原始数据,是重新捕获位置和原始释放位置的列名。在我提供的原始数据样本中:所有值都是ID代码,前两列是释放点,第三列是动物被重新捕获的地方,感谢分享可重复输入。请确保您的可复制输入也可实现样品输出。在这种情况下,这些值根本不匹配,因此很难猜测您要做什么。
library(reshape2)
df2 <- melt(
df,
id.vars = 'RECAP1'
)
df2[df2$RECAP1 %in% df2$value,1:2]
> df2[df2$RECAP1 %in% df2$value,1:2]
RECAP1 variable
1 3D9.1C2DBF8F56 RUW
7 3D9.1C2DBF8F56 RLW