Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/typescript/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 合并数据并接收大量数据丢失_R_Merge_Duplicates - Fatal编程技术网

R 合并数据并接收大量数据丢失

R 合并数据并接收大量数据丢失,r,merge,duplicates,R,Merge,Duplicates,我一直在准备我的数据,但在合并数据集后,不知何故,我得到的数据要少得多 由于我的数据中没有经度和纬度,因此在下载包zipcode后,我一直在使用以下代码(tel1是我包含zipcodes的数据) 然后我的观察数量下降到51006,我简直不敢相信。我的数据不可能有这么多的不匹配 有没有其他我应该使用的代码 之后,我一直试图用代码删除重复项 last <- with(final,final[order(state,latitude,longitude),]) last可以使用all参数进行

我一直在准备我的数据,但在合并数据集后,不知何故,我得到的数据要少得多

由于我的数据中没有经度和纬度,因此在下载包zipcode后,我一直在使用以下代码(
tel1
是我包含zipcodes的数据)

然后我的观察数量下降到51006,我简直不敢相信。我的数据不可能有这么多的不匹配

有没有其他我应该使用的代码

之后,我一直试图用代码删除重复项

 last <- with(final,final[order(state,latitude,longitude),])

last可以使用
all
参数进行
merge

merge(zipcode, tel1, by.x='zip', by.y='zip_code', all.y=TRUE)
但是,对于zipcode数据中未找到匹配项的行,将出现
NA
s。因此,如果您随后
na.rm
或类似的内容,您将以相同的“数据丢失”结束

检查合并后lat和long列中存在NAs的行的邮政编码:

tel1[is.na(tel1$latitude) | is.na(tel1$longitude),]

我猜它们不是有效的邮政编码,或者您的邮政编码列表不完整。

尝试使用plyr软件包中的
join
,这比merge直观得多。您还可以查看
all
参数以
merge
merge(zipcode,tel1,by.x='zip',by.y='zip_code',all.y=TRUE)
谢谢@Justin这算不上什么损失,但如果我继续finalw,我们无法解决数据中存在NA值的问题。如果任何列中有NA值,则使用
complete.cases
将删除整行。可能在读取数据时出现了问题,该数据生成了不应该存在的缺失值…?很好的一点是,有些行包含NA,因为我的数据不完整。我怎样才能把NA从列latitude&longitudeI gues中去掉Zipcode很好我的数据只是由另一列组成,其中有许多NA,因为没有相关信息。这就是为什么我应该删除经度和纬度为NA的行。如果我尝试代码finalthanks,我得到的只是在将其输入R;)之前从excel文件中删除列表
merge(zipcode, tel1, by.x='zip', by.y='zip_code', all.y=TRUE)
tel1[is.na(tel1$latitude) | is.na(tel1$longitude),]