从R中的字符串列转换Unicode字符

从R中的字符串列转换Unicode字符,r,unicode,encoding,character-encoding,R,Unicode,Encoding,Character Encoding,导入了一堆CSV,其中一列包含我认为是Unicode字符的内容 比如: PEÃ<U+0083>â<U+0080><U+0098>A SOPEÃ<U+0083>â<U+0080><U+0098>A PEÖA 索佩阿萨 不是所有的行,只是一些,但我已经尝试转换为“人类可读”字符,但没有用 迄今为止已测试过此解决方案,但尚未成功: 而这种野蛮的替代并没有起作用 gsub('Ã<U+0083>â<U+008

导入了一堆CSV,其中一列包含我认为是Unicode字符的内容

比如:

PEÃ<U+0083>â<U+0080><U+0098>A
SOPEÃ<U+0083>â<U+0080><U+0098>A
PEÖA
索佩阿萨
不是所有的行,只是一些,但我已经尝试转换为“人类可读”字符,但没有用

迄今为止已测试过此解决方案,但尚未成功:

而这种野蛮的替代并没有起作用

 gsub('Ã<U+0083>â<U+0080><U+0098>', 'Ñ', 'PEÃ<U+0083>â<U+0080><U+0098>A')

[1] "Ã<U+0083>â<U+0080><U+0098>"
gsub('195.'A','ñ','PE.'A')
[1] "Ãâ"

如果您正在使用
read.csv()
读取文件,是否尝试添加
encoding=“UCS-2LE”
参数?是,但目前为止没有成功。