R 使用非UTF-8数据修剪空白_R_Utf 8_Whitespace_Data Cleaning

R 使用非UTF-8数据修剪空白

r utf-8

R 使用非UTF-8数据修剪空白,r,utf-8,whitespace,data-cleaning,R,Utf 8,Whitespace,Data Cleaning,我正试图通过删除空白来清理一些数据。但当我运行此代码时，会出现以下错误： y <- y %>% mutate("Col1" = trimws(`Col2`, which = "both"))%>% mutate("Col2" = trimws(`Col2`, which = "both")) Error: Problem with `mutate()` input `Col2`. x

我正试图通过删除空白来清理一些数据。但当我运行此代码时，会出现以下错误：

y <- y %>% 
  mutate("Col1" = trimws(`Col2`, which = "both"))%>% 
  mutate("Col2" = trimws(`Col2`, which = "both"))


Error: Problem with `mutate()` input `Col2`.
x input string 33 is invalid UTF-8
i Input `Col2` is `trimws(`Col2`, which = "both")`

你在用什么操作系统？您知道您的字符值使用了什么编码吗？如何导入数据可能是个问题。@akrun，这是一个巨大的数据量，控制台上只显示了一堆“不，不，…”我能告诉你一些更具体的吗？大约有130万行。对不起，我指的是数据的子集。@pkpto39 CSV文件是从哪里来的？您需要知道CSV文件中使用了什么编码，以便正确地读取它。从数据本身你很难分辨出这一点。你确定使用了什么编码吗？@akrun，dput补充道。

> dput(t)
structure(list(Col1 = c("Area 1", "Area 2", "Area 3", "Area 4", 
"Area 5", "Area 6"), COl2 = c("BILLY JOE", "SALLY SUE", "LAURA Lane", 
"JOS<c9> SOME NAME", "NORMA NAME", "ESTER BETH")), class = c("spec_tbl_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -6L), spec = structure(list(
    cols = list(Col1 = structure(list(), class = c("collector_character", 
    "collector")), COl2 = structure(list(), class = c("collector_character", 
    "collector"))), default = structure(list(), class = c("collector_guess", 
    "collector")), skip = 1L), class = "col_spec"))