用R语言呈现缅甸文字

用R语言呈现缅甸文字,r,text,unicode,character-encoding,southeast-asian-languages,R,Text,Unicode,Character Encoding,Southeast Asian Languages,我正在处理缅甸文的文本,并试图用R运行一个主题模型。R似乎在显示和渲染缅甸文字符时遇到问题。当我将数据设置为data.frame时,缅甸字符将正确呈现: data<-read.csv("data.csv", fileEncoding ="UTF8", encoding="UTF-8", stringsAsFactors=FALSE) filenames<-data[,2] txts<-data[,5] docs <-data.frame(docs= txts,row.

我正在处理缅甸文的文本,并试图用R运行一个主题模型。R似乎在显示和渲染缅甸文字符时遇到问题。当我将数据设置为data.frame时,缅甸字符将正确呈现:

data<-read.csv("data.csv", fileEncoding ="UTF8", encoding="UTF-8", stringsAsFactors=FALSE) 
filenames<-data[,2]
txts<-data[,5] 
docs <-data.frame(docs= txts,row.names=filenames)
ds <- DataframeSource(docs)
cases<-Corpus(ds)
cases[[1]]

လိုက်... #[the rest is a text file with properly rendered Burmese]
其余部分是一段文本,其中一些重音符号显示不正确,如本例所示

我已经使用
Encoding()
检查了编码,R确认在这两种情况下我都使用UTF-8


仅供参考,我使用运行R64的Mac电脑。我有一位同事在使用PC时没有遇到此问题,但我们无法隔离此问题。

请参考,我已经研究了问题17715956,这是一个类似的问题,但不完全相同(我无法在非数据帧源中获取字符,与此问题相反;而且,该问题发生在PC上)
data[1,5]

လိုက\u103a