如何制作R';s read_csv2()正确识别文本字符
正在尝试使用如何制作R';s read_csv2()正确识别文本字符,r,utf-8,character,readr,R,Utf 8,Character,Readr,正在尝试使用read\u csv2()从readr软件包读取csv文件 问题是read\u csv2()无法正确识别字符,而R的默认read.csv2成功识别字符 例如: 原始值:KOZYATAĞI read_csv2()如何识别:KOZYATAI 我已经检查了帮助文件,还尝试了下面列出的编码;然而,这一切都无法实现 第一次尝试:以错误的字符结束 my_df <- read_csv2("my_path/my_file.csv") my_df@Amit,谢谢你的建议 在
read\u csv2()
从readr
软件包读取csv文件
问题是read\u csv2()
无法正确识别字符,而R的默认read.csv2
成功识别字符
例如:
原始值:KOZYATAĞI
read_csv2()
如何识别:KOZYATAI
我已经检查了帮助文件,还尝试了下面列出的编码;然而,这一切都无法实现
第一次尝试:以错误的字符结束
my_df <- read_csv2("my_path/my_file.csv")
my_df@Amit,谢谢你的建议
在RStudio上,我选择了File\Save with Encoding。。。查看一些可用的编码选项
在编码列表顶部弹出的窗口中,它显示了系统默认值(对于我的计算机是CP1254)。然后将其传递给编码参数,如下所示,它成功了
my_df <- read_csv2("my_path/my_file.csv", locale(encoding = "**CP1254**"), col_names = TRUE, col_types = NULL)
my_df现在在Rstudio上,看起来像这样的选项
然后,该代码起作用:
read\u csv(“C:path/file.csv”,locale(encoding=“ISO-8859-1”),col\u names=TRUE,col\u types=NULL)
西班牙语特殊字符正确加载(重音和ñ)。给我们一个前几行的dput来试试。否则。。。我也会尝试其他代码集。。。其他UTF。。。有时ANSI会因为一些奇怪的原因而工作
my_df <- read_csv2("my_path/my_file.csv", locale(encoding = "UTF-8"), col_names = TRUE, col_types = NULL)
my_df <- read_csv2("my_path/my_file.csv", locale(encoding = "**CP1254**"), col_names = TRUE, col_types = NULL)