处理特殊字符,例如R中的重音符号

处理特殊字符,例如R中的重音符号,r,character,R,Character,我正在做一些网络抓取的名称到一个数据帧 对于像“TomášRosický”这样的名字,我得到的结果是“TomÃÅRosický” 我试过了 Encoding("Tomáš Rosický") # with latin1 response 但不确定从那里得到带口音的原始名称。与iconv一起玩了没有成功 我会很满意(甚至可能更喜欢)您在UTF-8编码的页面中阅读的“Tomas Rosicky”的输出。如果x是您的姓名栏,请使用Encoding(x)正确读取文件使用扫描功能: namb

我正在做一些网络抓取的名称到一个数据帧

对于像“TomášRosický”这样的名字,我得到的结果是“TomÃÅRosický”

我试过了

Encoding("Tomáš Rosický") #  with latin1 response
但不确定从那里得到带口音的原始名称。与iconv一起玩了没有成功


我会很满意(甚至可能更喜欢)您在UTF-8编码的页面中阅读的“Tomas Rosicky”的输出。如果
x
是您的姓名栏,请使用
Encoding(x)正确读取文件使用扫描功能:

namb <- scan(file='g:/testcodering.txt', fileEncoding='UTF-8',
what=character(), sep='\n', allowEscapes=T)
cat(namb)

namb正确导出重音的方法:

enc2utf8(as(dataframe$columnname, "character"))
您应该使用以下选项:

df$colname <- iconv(df$colname, from="UTF-8", to="LATIN1")

df$colname您是如何读取data.frame的?通常您可以向
read.table
提供一个编码参数,例如
fileEncoding
。正如@Hong Ooi所回答的,UTF-8似乎是您需要的编码。您也可以添加一些解释吗?
df$colname <- iconv(df$colname, from="UTF-8", to="LATIN1")