R中文本列中出现的奇怪字符

R中文本列中出现的奇怪字符,r,R,我正在从Excel R中传输一个CSV文件。我的其中一列包含每次观察的文本,但最终以以下方式显示: "Hey! \x8c\xe6 Maybe I can give some suggestions: \x8c\xe6" \x8c\xe6发生了什么?我是否可以做点什么,使我只有A-Z,A-Z,以及,+/\?*()等字符。用gsub删除所有不可打印的字符怎么样 a <- "Hey! \x8c\xe6 Maybe I can give some suggestions: \x8c\xe6"

我正在从Excel R中传输一个CSV文件。我的其中一列包含每次观察的文本,但最终以以下方式显示:

"Hey! \x8c\xe6 Maybe I can give some suggestions: \x8c\xe6" 

\x8c\xe6
发生了什么?我是否可以做点什么,使我只有
A-Z,A-Z
,以及
,+/\?*()
等字符。

gsub
删除所有不可打印的字符怎么样

a <- "Hey! \x8c\xe6 Maybe I can give some suggestions: \x8c\xe6"
gsub("[^[:print:]]","",a)

# [1] "Hey!  Maybe I can give some suggestions: "

a用
gsub

a <- "Hey! \x8c\xe6 Maybe I can give some suggestions: \x8c\xe6"
gsub("[^[:print:]]","",a)

# [1] "Hey!  Maybe I can give some suggestions: "

a这是一个编码错误,我在R中得到了很多(请看此以了解翻译问题)。我做了一件完全没有效率的事情,我会使用“gsub”来处理我能看到的错误,只是简单地删除它们:

gsub('\\x8c\\xe6', '', data)

然而,这篇文章可能有助于检测正确的编码:

这是一个编码错误,我在R中得到了很多这样的信息(请参阅本文以了解翻译问题)。我做了一件完全没有效率的事情,我会使用“gsub”来处理我能看到的错误,只是简单地删除它们:

gsub('\\x8c\\xe6', '', data)

但是,这篇文章可能有助于检测正确的编码:

这是由于指定的编码不正确造成的。从Excel保存时,可以指定编码。另存为->工具->Web选项->编码。可能将其设置为utf-8。这是由于指定的编码不正确。从Excel保存时,可以指定编码。另存为->工具->Web选项->编码。可能设置为utf-8.MrFlick,你救了我。非常感谢你!Flick先生,你救了我。非常感谢你!