从R中的字符串列转换Unicode字符_R_Unicode_Encoding_Character Encoding

从R中的字符串列转换Unicode字符

r unicode encoding character-encoding

从R中的字符串列转换Unicode字符,r,unicode,encoding,character-encoding,R,Unicode,Encoding,Character Encoding,导入了一堆CSV，其中一列包含我认为是Unicode字符的内容比如： PEÃ<U+0083>â<U+0080><U+0098>A SOPEÃ<U+0083>â<U+0080><U+0098>A PEÃ–A 索佩阿萨不是所有的行，只是一些，但我已经尝试转换为“人类可读”字符，但没有用迄今为止已测试过此解决方案，但尚未成功：而这种野蛮的替代并没有起作用 gsub('Ã<U+0083>â<U+008

导入了一堆CSV，其中一列包含我认为是Unicode字符的内容

比如：

PEÃ<U+0083>â<U+0080><U+0098>A
SOPEÃ<U+0083>â<U+0080><U+0098>A

PEÃ–A
索佩阿萨

不是所有的行，只是一些，但我已经尝试转换为“人类可读”字符，但没有用

迄今为止已测试过此解决方案，但尚未成功：

而这种野蛮的替代并没有起作用

 gsub('Ã<U+0083>â<U+0080><U+0098>', 'Ñ', 'PEÃ<U+0083>â<U+0080><U+0098>A')

[1] "Ã<U+0083>â<U+0080><U+0098>"

gsub（'195.'A'，'ñ'，'PE.'A'）
[1] "Ãâ"

如果您正在使用

read.csv（）

读取文件，是否尝试添加

encoding=“UCS-2LE”

参数？是，但目前为止没有成功。