通过R标准化地址
我有一个CSV文件,其中包含emailAddress、Address1、Address2、city和state列,其中数据不唯一通过R标准化地址,r,R,我有一个CSV文件,其中包含emailAddress、Address1、Address2、city和state列,其中数据不唯一 EmailAddress Address1 Address2 City State xyz@gmail.com 510 E. Fellows St., unit 2 Fallon NV abc@yahoo.com 4432 Lockhill Selma Rd.
EmailAddress Address1 Address2 City State
xyz@gmail.com 510 E. Fellows St., unit 2 Fallon NV
abc@yahoo.com 4432 Lockhill Selma Rd. Sarosta FL
我希望这些地址被标准化,并且在和之间的句点空格最终被删除。为此,我尝试了gsub,但没有成功。我还想把圣斯佩尔当作街,把Rd当作路
期望输出:
EmailAddress Address1 Address2 City State
xyz@gmail.com 510 East Fellows Street,Unit 2 Fallon NV
abc@yahoo.com 4432 Lockhill Selma Road Sarosta FL
我试过了
Address <- read.csv("c:Desktop\\New Folder\\Address.csv", header=T, sep=",", stringsAsFactors = FALSE)
A_df <- as.data.frame(Address)
Address1 <- gsub("\\.", "", A_df$Address1)
Address它对我很有效。除非你想把它放在数据框里而不是向量里。最后我可能会去掉任何句号。它只与regex
模式一起工作,因此应该为您提供要使用的模式
A_df$Address1 <- gsub("\\Rd", "Road", A_df$Address1)
A_df$Address1 <- gsub("\\St.", "Street", A_df$Address1)
A_df$Address1 <- gsub("\\.", "", A_df$Address1)
A_df$Address1这部分也适用于我,但我希望Rd成为Road,st也成为street。有什么帮助吗??以及如何在最终报告中包含所有列