R 从df中删除特定的单词和符号
我有一个这样的数据帧结构,39行R 从df中删除特定的单词和符号,r,word,R,Word,我有一个这样的数据帧结构,39行 text. "A" OR "B" OR "C" "C" OR "D" OR "E" 以及我要删除的单词的“黑名单”,以符号“(200个单词)开头和结尾。下面是一个示例: blackList "A" "D" 我想从起始数据帧中删除它们,获得: text. OR "B" OR "C" "C" OR OR "E" 怎么办?我尝试了removeWords,但它没有读取符号“”gs
text.
"A" OR "B" OR "C"
"C" OR "D" OR "E"
以及我要删除的单词的“黑名单”,以符号“(200个单词)开头和结尾。下面是一个示例:
blackList
"A"
"D"
我想从起始数据帧中删除它们,获得:
text.
OR "B" OR "C"
"C" OR OR "E"
怎么办?我尝试了removeWords,但它没有读取符号“”gsub(“\'A\'”、“,'A”或“B”或“C”)
用反斜杠转义引号并使用gsub我们可以创建一个模式,将所有黑名单项与“|”一起粘贴为可折叠参数,然后将它们全部删除
df$text <- gsub(paste0(blacklist$blackList, collapse = "|"), "", df$text)
df
# text
#1 OR "B" OR "C"
#2 "C" OR OR "E"
df$text它可以工作,但我必须为黑名单中的所有条款执行。你能在你的问题中提供dput(myData)
而不是粘贴数据值吗?
df <- data.frame(text = c('"A" OR "B" OR "C"','"C" OR "D" OR "E"'))
blacklist <- data.frame(blackList = c('"A"', '"D"'))