R b';导入数据集时,在字符变量的每个字符串之前添加

R b';导入数据集时,在字符变量的每个字符串之前添加,r,fread,read.csv,R,Fread,Read.csv,我试图导入一个数据集,但我遇到了一个问题:对于字符变量,在每个字符串之前都添加了一个b' 这里有一个例子。 $STATUT:chr“b'EX”“b'PA”“b'EX”“”… 我在使用fread和read.csv时也遇到同样的问题。有人知道问题是什么吗?可能是编码问题。如果在文本编辑器中查看,文件中是否存在b's?否,文件中没有b'。我试着用fread(和拉丁语-1)将编码更改为UTF-8,但没有任何改变。我认为b表示二进制编码的文件,可能来自python源代码。在阅读文件之前,您是否尝试过以rb

我试图导入一个数据集,但我遇到了一个问题:对于字符变量,在每个字符串之前都添加了一个b'

这里有一个例子。
$STATUT:chr“b'EX”“b'PA”“b'EX”“”…


我在使用fread和read.csv时也遇到同样的问题。有人知道问题是什么吗?

可能是编码问题。如果在文本编辑器中查看,文件中是否存在
b'
s?否,文件中没有
b'
。我试着用fread(和拉丁语-1)将编码更改为UTF-8,但没有任何改变。我认为
b
表示二进制编码的文件,可能来自python源代码。在阅读文件之前,您是否尝试过以
rb
模式打开文件(请参见
?open
)?在读入文件(其中
a
是问题变量)后,您始终可以使用
gsub(“^b\\”(.+)\\\'$”、“\\1”,a)
之类的方法来清除这些文件。我认为您对二进制编码的文件是正确的。我已经寻找了一个使用fread的解决方案,但似乎还没有实现。我将使用(手动)版本删除它。非常感谢您的帮助!这可能是编码问题。如果您在文本编辑器中查看,文件中是否存在
b'
s?不,文件中没有
b'
。我已尝试将编码更改为fread(和拉丁语-1)中的UTF-8,它不会改变任何东西。我认为
b
表示一个二进制编码的文件,可能来自python源代码。在阅读之前,您是否尝试过在
rb
模式下打开该文件(请参见
?open
)?在读入它们之后,您总是可以使用类似于
gsub(^b\\\'(.+)\'$,“\\1”,a)的东西来摆脱它们(其中
a
是问题变量)。我认为您对二进制编码文件的看法是正确的。我已经寻找了一个解决方案来使用fread,但似乎还没有实现。我将使用(手动)版本来删除它。非常感谢您的帮助!