删除<;U+;00A0>;从R中列中的值

删除<;U+;00A0>;从R中列中的值,r,encoding,utf-8,R,Encoding,Utf 8,当我使用read.csv和encoding参数读取我的csv文件时,我得到了一些值 application <- read.csv("application.csv", na.strings = c("N/A","","NA"), encoding = "UTF-8") 应用程序两个选项: application <- read.csv("application.csv", na.strings = c("N/A","","NA"), encoding = "ASCII") 将U

当我使用read.csv和encoding参数读取我的csv文件时,我得到了一些值

application <- read.csv("application.csv", na.strings = c("N/A","","NA"), encoding = "UTF-8")
应用程序两个选项:

application <- read.csv("application.csv", na.strings = c("N/A","","NA"), encoding = "ASCII")
将UTF-8转换为ASCII将删除打印的UTF-8语法,但保留空格。请注意,如果字符串的开头或结尾有额外的空格,则可能会得到不需要的唯一值。例如,转换为ASCII的
“满足期望值”
将读取
“满足期望值”
,这不等于
“满足期望值”

两个选项:

application <- read.csv("application.csv", na.strings = c("N/A","","NA"), encoding = "ASCII")

将UTF-8转换为ASCII将删除打印的UTF-8语法,但保留空格。请注意,如果字符串的开头或结尾有额外的空格,则可能会得到不需要的唯一值。例如,
“满足的期望值”
转换为ASCII将读取
“满足的期望值”
,这并不等于
“满足的期望值”
,这个问题让我厌烦了很长时间,我在R社区到处搜索,“R”标签中的答案在我的情况下都不起作用。在我扩展搜索区域之前,我在“java”标签中得到了有效的答案。 好的,对于数据帧,解决方案是:

application <- as.data.frame(lapply(application, function(x) {
              gsub("\u00A0", "", x) 
         })) 

application这个问题让我厌烦了很长一段时间,我在R社区到处搜索,在我的情况下,“R”标签中没有答案。在我扩展搜索区域之前,我在“java”标签中得到了有效的答案。
好的,对于数据帧,解决方案是:

application <- as.data.frame(lapply(application, function(x) {
              gsub("\u00A0", "", x) 
         })) 

application这不是一个很好的答案,但是要将您的csv返回UTF-8,您可以在google sheets中打开它,然后作为.csv下载。然后使用trim_ws=T导入。这将解决导入问题,不会产生任何奇怪的效果。

这不是一个很好的答案,但要将您的csv返回UTF-8,您可以在google sheets中打开它,然后作为.csv下载。然后使用trim_ws=T导入。这将解决导入问题,不会产生任何奇怪的效果。

如果它只是一个带有额外字符的列。以这个名称,您可以运行类似这样的操作来替换。使用空格
sub(“\\.”,“”,dataframe$列)
@Kristofersen:问题不在于列名,而在于每列中的值。我用更多的信息编辑了这篇文章。对不起,这个代码实际上适用于这个专栏。只需将dataframe替换为您的dataframe名称,将column替换为您的列名以及所有内容。将被一个空格替换。@Kristofersen很抱歉我能理解你的意思,但我问的问题不清楚。我添加了一个问题示例,并使问题保持简单。当我使用“编码”作为参数时,我会输入一些值。我希望从数据集中删除这些内容。如果它只是一个包含额外内容的列。以这个名称,您可以运行类似这样的操作来替换。使用空格
sub(“\\.”,“”,dataframe$列)
@Kristofersen:问题不在于列名,而在于每列中的值。我用更多的信息编辑了这篇文章。对不起,这个代码实际上适用于这个专栏。只需将dataframe替换为您的dataframe名称,将column替换为您的列名以及所有内容。将被一个空格替换。@Kristofersen很抱歉我能理解你的意思,但我问的问题不清楚。我添加了一个问题示例,并使问题保持简单。当我使用“编码”作为参数时,我会输入一些值。我希望从数据集中删除这些。
application <- as.data.frame(lapply(application, function(x) {
              gsub("\u00A0", "", x) 
         }))