R 不同操作系统/语言的汉字编码

R 不同操作系统/语言的汉字编码,r,excel,encoding,R,Excel,Encoding,我无法将包含简体中文字符的csv文件读入我的r。我尝试过编码=utf-8、gb18130、gb2130等。无法显示汉字 我还尝试将excel的编码更改为utf8 csv,运气不好。 我也 尝试使用中文窗口并将区域设置设置为中国。不走运 在我换成中文窗口之后。excel可以打开我的csv(英文) windows无法正确打开它)。r studio可以在中打开它 View(),但R控制台无法读取我的csv,即使我 以中文版本重新安装r 我试过Ubuntu,Ubuntu甚至根本无法读取我的csv。至少在

我无法将包含简体中文字符的csv文件读入我的r。我尝试过编码=utf-8、gb18130、gb2130等。无法显示汉字

我还尝试将excel的编码更改为utf8 csv,运气不好。
我也 尝试使用中文窗口并将区域设置设置为中国。不走运

在我换成中文窗口之后。excel可以打开我的csv(英文) windows无法正确打开它)。r studio可以在中打开它 View(),但R控制台无法读取我的csv,即使我 以中文版本重新安装r

我试过Ubuntu,Ubuntu甚至根本无法读取我的csv。至少在Windows中,R studio可以很好地读取我的数据

我试过谷歌表单。但是我的文件太大了,Google sheet会 甚至都没打开

我在Ubuntu中使用CAL并将其转换为GB*,因为GB是 在Windows R studio中工作正常。不走运。而这需要超过10分钟 将我的200Mb-750Mb数据转换为gb18013的分钟数


Ubuntu使用UTF-8作为默认中文编码。因此,您应该将其编码为UTF-8,而不是GB18130或其他GB起始编码

  • (1) 下载Open Office(免费快速安装,具有更高的可用性) 文件大小大于Ubuntu中的Cals)

  • (2) 检测您的CSV编码。只需使用open office打开您的csv,然后选择显示您的汉字的编码方法

  • (3) 根据您的需要将csv保存为正确的编码 操作系统。默认的Windows编码是GBK中文,Ubuntu是UTF8


这将解决您的文件大小问题和编码问题。您甚至不必强制编码。正常的
read.csv
就可以了。

如果你经常处理汉字的话。我建议你坚持中国风,这会让你的生活在大多数时候变得更轻松。说得对。我正在尝试使用中文Windows和英文Ubuntu。为什么我的excel可以打开我的csv,但我的access无法正确打开它?在access中,您可以指定编码方法。选择任何以简体中文G*开头的编码。