R 变量a与变量b同时存在的日期折线图?

R 变量a与变量b同时存在的日期折线图?,r,data-visualization,R,Data Visualization,一般来说,我对统计、R和编程都是新手,只上了一小段课就被抛到了最深处。然而,我渴望为自己解决问题 我的第一项任务是检查提供给我的数据是否存在异常。我收到了一份电子表格,上面有Date、PersonID和PlaceID。我假设,如果我将PersonID的每个因子与Date进行对比,一条直线将表明没有异常,因为PersonID一次只能存在于一个地方。然而,我担心的是,如果在一个日期上有两个相同的人名,我的绘图就无法显示这一点 我使用了简单的代码: require(ggplot2) qplot(Dat

一般来说,我对统计、R和编程都是新手,只上了一小段课就被抛到了最深处。然而,我渴望为自己解决问题

我的第一项任务是检查提供给我的数据是否存在异常。我收到了一份电子表格,上面有
Date
PersonID
PlaceID
。我假设,如果我将
PersonID
的每个因子与
Date
进行对比,一条直线将表明没有异常,因为
PersonID
一次只能存在于一个地方。然而,我担心的是,如果在一个
日期
上有两个相同的
人名
,我的绘图就无法显示这一点

我使用了简单的代码:

require(ggplot2)
qplot(Date,PersonID)
我的问题是我不确定如何将
日期
考虑到这个问题中。基本上,我正在尝试检查在同一个
日期
的多个
PlaceID
中是否没有
PersonID
,并且已经尝试了2天,无法确定如何将所有3个变量放在同一个图上


我不是要求有人为我写代码。我只是想知道我的思路是否正确,如果是的话,我应该如何考虑让R来画这个。有人能帮我吗?如果这个问题太冗长,或者发错了地方,我们深表歉意。

如果您只想知道数据集中是否出现这种情况,请尝试
duplicated()
。例如,假设您的数据帧被称为
df

sum(duplicated(df[,c("Date","PersonID")]))

将根据数据框中的列
Date
PersonID
返回重复的数字。如果大于零,则数据中存在重复项。

为什么要使用绘图来执行此操作?我的主管提出了建议,但一直不在,因此我无法与他联系,并希望在他下周返回时完成我项目的这一阶段。你能推荐一种不同的方法吗?我还要补充一点,在这个特定的数据集中有将近100000行。