Encoding 源窗口中的随机符号,而不是RStudio中的俄文字符

Encoding 源窗口中的随机符号,而不是RStudio中的俄文字符,encoding,rstudio,Encoding,Rstudio,我一直在谷歌搜索和堆码溢出是的,这就是如何解决错误编码的问题。然而,我找不到解决办法 我正在尝试加载带有UTF-8编码的.Rmd文件,它基本上包含俄语字符。它们没有正确地显示出来。相反,源窗口中的代码行如下所示: 最初,我在很久以前的笔记本电脑上创建了这个.Rmd文件。现在,我正在使用另一个,我无法在这里发现问题 我已经尝试过使用一些Sys.setlocale命令,但没有成功 我在Windows10上运行RStudio 编辑 这是readBin'raw[1].Rmd',raw,10000的输

我一直在谷歌搜索和堆码溢出是的,这就是如何解决错误编码的问题。然而,我找不到解决办法

我正在尝试加载带有UTF-8编码的.Rmd文件,它基本上包含俄语字符。它们没有正确地显示出来。相反,源窗口中的代码行如下所示:

最初,我在很久以前的笔记本电脑上创建了这个.Rmd文件。现在,我正在使用另一个,我无法在这里发现问题

我已经尝试过使用一些Sys.setlocale命令,但没有成功

我在Windows10上运行RStudio

编辑 这是readBin'raw[1].Rmd',raw,10000的输出。从2075到2211切片:

[2075] 64 31 32 2c 20 71 68 35 20 3d 3d 20 22 d0 a0 d1 9a d0 a0 d0 88 d0 a0 
e2 80 93 d0 a0 d0 8e d0 a0 d1 99
[2109] d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20 64 31 32 6d 24 71 68 35 20 3d 
20 4e 55 4c 4c 0d 0a 64 31 35 6d
[2143] 20 3d 20 66 69 6c 74 65 72 28 64 31 35 2c 20 74 68 35 20 3d 3d 20 22 
d0 a0 d1 9a d0 a0 d0 88 d0 a0 e2
[2177] 80 93 d0 a0 d0 8e d0 a0 d1 99 d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20 
64 31 35 6d 24 74 68 35 20 3d 20

谢谢。

Windows对UTF-8没有很好的支持。很可能您的本地编码是其他的

RStudio通常使用系统编码读取文件。如果这是错误的,您可以使用文件|使用编码重新打开。。。使用不同的编码重新打开文件

编辑以添加:


示例输出的第一行看起来像UTF-8编码,带有一些西里尔字母,但不是俄语文本。我将其解码为d12,qh5=\ª¥ª¥ª¥ª¥ª¥ª¥。这就是RStudio在您重新打开文件并声明为UTF-8时给您的吗?

您确定该文件是UTF-8吗?不,我不确定。有办法找到答案吗?你知道,它的实际编码。运行readBinyourfile,raw,100并显示结果。也许这里会有人认出它。UTF-8中的俄语看起来像“[1]d0 9b d0 be d1 80 d0 b5 d0 bc 20…”我认为100个字符不足以达到俄语位。这看起来像是一个ASCII格式的Windows文件,但许多俄文编码将ASCII复制为罗马字母。在进入俄语部分之前,您需要阅读更多内容,其中应显示80到FF范围内的一些字节。将其设置为500个字符。