如何删除“ÂÂ&引用;从R中的文本中删除?
在我拼凑了一些文本后,“Ô将添加在文本中的某些单词和数字之后。为了消除不需要的“Ô,我做了几个GSUB如何删除“ÂÂ&引用;从R中的文本中删除?,r,special-characters,gsub,R,Special Characters,Gsub,在我拼凑了一些文本后,“Ô将添加在文本中的某些单词和数字之后。为了消除不需要的“Ô,我做了几个GSUB text <- gsub("Ã", " ", text) text <- gsub("Â", " ", text) text <- gsub(",", "", text) text <- gsub(" ", " ", text) gsubs之后的文本 ALBANY ‚ OFF ‚ REBOUND BY #43 ‚ STIRE #43 ‚
text <- gsub("Ã", " ", text)
text <- gsub("Â", " ", text)
text <- gsub(",", "", text)
text <- gsub(" ", " ", text)
gsubs之后的文本
ALBANY ‚ OFF ‚ REBOUND BY #43 ‚ STIRE #43 ‚ STIRE is not commented out
我希望文本是什么样子的:
ALBANY OFF REBOUND BY #43 STIRE #43 STIRE is not commented out
任何帮助都将不胜感激。如果需要更多信息,请告诉我。您可以使用
库(stringr)
然而,我认为这首先是一个编码问题。
此外,
gsub
或str_-replace_-all
的结果可能会与编码不同,这可能是为什么您的文本只在1gsub()中进行编码:gsub(“Ô、“奥尔巴尼”OFF“反弹”)
相反,您是否考虑过代码中存在一些编码错误的可能性?
ALBANY OFF REBOUND BY #43 STIRE #43 STIRE is not commented out
text <- "ALBANYÃ, OFFÃ, REBOUND BY"
library(stringr)
str_replace_all(text, "Ã,Â", "")
#> [1] "ALBANY OFF REBOUND BY"
gsub("Ã,Â","",text)
#> [1] "ALBANY OFF REBOUND BY"