R GSub删除第一个数字之前的所有字符
我用R来清理一些非常脏的地址。我想使用gsub删除字符串中第一个数字前面的所有字符,但can似乎无法找到一个有效的正则表达式。有什么建议吗 以下是三个数据示例: 转交鲍勃·琼斯大街1071号 请填写VERIFY64中心路 Joe's Bakery 33 Pleasant Ave#4你可以这样试试R GSub删除第一个数字之前的所有字符,r,regex,gsub,R,Regex,Gsub,我用R来清理一些非常脏的地址。我想使用gsub删除字符串中第一个数字前面的所有字符,但can似乎无法找到一个有效的正则表达式。有什么建议吗 以下是三个数据示例: 转交鲍勃·琼斯大街1071号 请填写VERIFY64中心路 Joe's Bakery 33 Pleasant Ave#4你可以这样试试 library(dplyr) library(stringr) df %>% mutate(V2 = str_extract_all(V1, "\\d+.*")) #
library(dplyr)
library(stringr)
df %>%
mutate(V2 = str_extract_all(V1, "\\d+.*"))
# V1 V2
# 1 C/O Bob Jones1071 Main St 1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road 64 Center Road
# 3 Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4
资料
由于地址不符合格式,所以找不到覆盖所有地址的地址。您可以尝试
^\D+
structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road",
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA,
-3L))