损坏的Rmarkdown脚本:我如何找回西里尔文字?

损坏的Rmarkdown脚本:我如何找回西里尔文字?,r,nlp,rstudio,r-markdown,R,Nlp,Rstudio,R Markdown,几周来,我一直在使用一个包含大量西里尔文字的脚本(从一块到另一块)。有一天,我打开了一个新的Rmarkdown脚本,在那里我写了英语,而另一个文档仍在我的R会话中。之后,我又回到西里尔文的文档中,所有写的东西都变成了这样的8¸ÐÐÐÐ1995--> 问题是:问题的根源在哪里?而且,被破坏的脚本如何能变成它的原始形式(带有西里尔文字) 更新 我尝试过用编码CP1251、CP1252、windows1251和UTF8重新标记Rstudio纸条,但它不起作用。当然,奇怪的符号会变成另一个奇怪的符号。

几周来,我一直在使用一个包含大量西里尔文字的脚本(从一块到另一块)。有一天,我打开了一个新的Rmarkdown脚本,在那里我写了英语,而另一个文档仍在我的R会话中。之后,我又回到西里尔文的文档中,所有写的东西都变成了这样的
8¸ÐÐÐÐ1995-->

问题是:问题的根源在哪里?而且,被破坏的脚本如何能变成它的原始形式(带有西里尔文字)


更新

我尝试过用编码CP1251、CP1252、windows1251和UTF8重新标记Rstudio纸条,但它不起作用。当然,奇怪的符号会变成另一个奇怪的符号。问题是我一开始就用默认编码CP1251和windows1251)保存了文档


解决方案:
如果使用西里尔字母和拉丁字母,请确保在计算机为windows(我不知道mac)时始终使用UTF-8编码保存Rstudio脚本。如果关闭脚本并再次打开,请使用UTF8编码重新打开该文件

假设您使用的是RStudio:打开*.Rmd文件,然后尝试“用编码”重新打开它。因此,只需使用如下所示的文件菜单

选择“显示所有编码”并选择您的特定编码,我建议使用windows-1251进行西里尔语编码:

注意:显然,在一次以“独立”方式打开*.Rmd文件时,以及在另一次从R项目中打开时,也会出现此问题


希望这会有所帮助。

我正要更新帖子@jaySf,因为我已经尝试了+CP1251和UTF8。它不起作用,但可以肯定的是,奇怪的符号会变成另一个奇怪的符号:')(可能问题是我用默认值保存了文档encoding@adrian-del rio rodriguez坏东西,也许值得一看?是的,它在某些情况下有效。我想问题是我必须将脚本保存为UTF-8(没有CP-1251或Windows1252)并且确保始终是这样。这就是我如何避免再次出现问题的方法。此外,我已将代码保存为.csv文件。很高兴听到这一消息,并且您已经找到了避免将来出现问题的方法!