有没有办法在R中使用iconv()来正确编码整个数据帧?
我正在处理一个新的数据集,但导入后,它显示了一个不正确的编码。所有的“ã”都以其他形式出现 我找到了一种使用iconv()修复列的方法,但是有没有一种简单的方法可以将它用于所有389列有没有办法在R中使用iconv()来正确编码整个数据帧?,r,R,我正在处理一个新的数据集,但导入后,它显示了一个不正确的编码。所有的“ã”都以其他形式出现 我找到了一种使用iconv()修复列的方法,但是有没有一种简单的方法可以将它用于所有389列 md2016您可以使用lappy: md2016new <- lapply(md2016, iconv, to = "UTF-8") md2016new您可以使用lappy: md2016new <- lapply(md2016, iconv, to = "UTF-8") md2016new您可以
md2016您可以使用lappy
:
md2016new <- lapply(md2016, iconv, to = "UTF-8")
md2016new您可以使用lappy
:
md2016new <- lapply(md2016, iconv, to = "UTF-8")
md2016new您可以直接将数据加载到数据帧中,然后一步将其转换。
您需要“readr”(独立版或“tidyverse”的一部分)
首先猜猜输入数据的编码是什么
readr::guess_encoding("path/to/file.csv")
注意结果,对我来说是
# A tibble: 2 x 2
encoding confidence
<chr> <dbl>
1 ISO-8859-1 0.27
2 ISO-8859-2 0.21
#一个tible:2x2
编码置信度
1 ISO-8859-1 0.27
2 ISO-8859-2 0.21
然后使用readr和一些参数,包括上面找到的输入编码值
data <- read_csv("path/to/file.csv",
locale = locale(encoding = "ISO-8859-2",
asciify = TRUE))
data您可以直接将数据加载到数据帧中,并在一个步骤中进行转换。
您需要“readr”(独立版或“tidyverse”的一部分)
首先猜猜输入数据的编码是什么
readr::guess_encoding("path/to/file.csv")
注意结果,对我来说是
# A tibble: 2 x 2
encoding confidence
<chr> <dbl>
1 ISO-8859-1 0.27
2 ISO-8859-2 0.21
#一个tible:2x2
编码置信度
1 ISO-8859-1 0.27
2 ISO-8859-2 0.21
然后使用readr和一些参数,包括上面找到的输入编码值
data <- read_csv("path/to/file.csv",
locale = locale(encoding = "ISO-8859-2",
asciify = TRUE))
数据需要注意的一点是,在R中,UTF-8和数据帧在Windows上不混合。需要注意的一点是,在R中,UTF-8和数据帧在Windows上不混合。