通过RMeCab/MeCab加载带UTF-8的日语词典

通过RMeCab/MeCab加载带UTF-8的日语词典,r,dictionary,encoding,utf-8,R,Dictionary,Encoding,Utf 8,我想问一下,是否有人有将MeCab中的日语词典数据编码为UTF-8的经验。 我已经安装了MeCab,并在R中安装了RMeCab包,以便用日语制作单词地图,但是词性标记似乎不起作用,因为字典数据没有编码到UTF-8中 library("RMeCab") library("wordcloud") setwd('C:\\Users\\sukyu\\Desktop\\JP') word <- RMeCabFreq("OLS_Japantext.txt") word <- subset(wor

我想问一下,是否有人有将MeCab中的日语词典数据编码为UTF-8的经验。 我已经安装了MeCab,并在R中安装了RMeCab包,以便用日语制作单词地图,但是词性标记似乎不起作用,因为字典数据没有编码到UTF-8中

library("RMeCab")
library("wordcloud")
setwd('C:\\Users\\sukyu\\Desktop\\JP')
word <- RMeCabFreq("OLS_Japantext.txt")
word <- subset(word,Info1=="名詞")
type <- c("数","非自立","接尾")
word <- subset(word,!Info2%in% type)
word <- word[order(word$Freq,decreasing =T ),]
pal <- brewer.pal(8,"Spectral")
par(family = "HiraKakuProN-W3")
wordcloud(word$Term,word$Freq,min.freq = 1,colors=pal,
      random.order = TRUE,scale = c(5,4))
库(“RMeCab”)
图书馆(“wordcloud”)
setwd('C:\\Users\\sukyu\\Desktop\\JP')

word虽然默认情况下它不使用UTF8,但MeCab有一个构建选项来强制它。试着这样做:

./configure --with-charset=utf8 --enable-utf8-only

这应该可以解决它。

虽然默认情况下它不使用UTF8,但MeCab有一个构建选项来强制它。试着这样做:

./configure --with-charset=utf8 --enable-utf8-only
这应该可以解决问题