使用正则表达式删除R数据框中的引号
下面是我的数据集(名为g)现在的样子。我在R工作使用正则表达式删除R数据框中的引号,r,regex,gsub,R,Regex,Gsub,下面是我的数据集(名为g)现在的样子。我在R工作 Q.35 | Q.36 | age | gender | country 2 | 2 | 1 | 20 | 2 | AU" 3 | 5 | 5 | 21 | 1 | AU" 我想删除国家代码(AU而不是AU)上的引号。但是我尝试过的正则表达式不起作用 h <- grep("\"", "", g) h <- grep(""", "", g) h <- grep('"', '', g) hgr
Q.35 | Q.36 | age | gender | country
2 | 2 | 1 | 20 | 2 | AU"
3 | 5 | 5 | 21 | 1 | AU"
我想删除国家代码(AU而不是AU)上的引号。但是我尝试过的正则表达式不起作用
h <- grep("\"", "", g)
h <- grep(""", "", g)
h <- grep('"', '', g)
hgrep
仅在字符向量的每个元素中搜索匹配项,如果要替换特定图案的第一个匹配项,请使用sub
或gsub
替换所有匹配项
示例:
> h <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
> h$country <- gsub('"', '', h$country)
> h
# age country
# 1 20 AU
# 2 21 AU
>h$country h
#年龄国家
#120澳元
#21AU
另外,还有一个不错的软件包stringr
,它提供了一种操作字符串的方便方法:
df <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
require(stringr)
df$country <- str_replace_all(string = df$country, pattern = '"', replacement = "")
dfsub
/gsub
不是grep
哇,我都没想到!谢谢!
df <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
require(stringr)
df$country <- str_replace_all(string = df$country, pattern = '"', replacement = "")