使用KoNLP提取R中的名词时出错

使用KoNLP提取R中的名词时出错,r,csv,encoding,nlp,extract,R,Csv,Encoding,Nlp,Extract,我试图提取R的名词。当使用程序R时,出现一个错误。我编写了以下代码: setwd("C:\\Users\\kyu\\Desktop\\1-1file") library(KoNLP) useSejongDic() txt <- readLines(file("1_2000.csv")) nouns <- sapply(txt, extractNoun, USE.NAMES = F) setwd(“C:\\Users\\kyu\\Desktop\\1-1文件”) 图书馆(KoNLP

我试图提取R的名词。当使用程序R时,出现一个错误。我编写了以下代码:

setwd("C:\\Users\\kyu\\Desktop\\1-1file")
library(KoNLP)
useSejongDic()

txt <- readLines(file("1_2000.csv"))
nouns <- sapply(txt, extractNoun, USE.NAMES = F)
setwd(“C:\\Users\\kyu\\Desktop\\1-1文件”)
图书馆(KoNLP)
useSejongDic()

txt行数应该不是问题

我认为编码可能有问题。看这个。您的.csv文件编码为EUC-KR

我使用以下命令将编码更改为UTF-8

txtUTF <- read.csv(file.choose(), encoding = 'UTF-8')
nouns <- sapply(txtUTF, extractNoun, USE.NAMES = F)

txtf请发布
dput(txt)
的结果,以使错误重现您的意思是发布1_2000.csv文件?当然,为什么不呢?我想共享那个文件,但我不知道如何共享我昨天注册的那个文件,所以我不能很好地使用这个网页,你能帮我发布那个文件吗?而且,该文件由韩语组成,可以吗?您可以在外部托管该文件(例如,在Google Drive或Dropbox上)并共享链接。好的,非常感谢。真的非常感谢你。当我使用该代码时,错误出现“在预处理中(句子):输入必须是合法字符!”这句话。当我看到博肯的角色时,我忽略了这一点,继续使用其他代码。虽然我解决不了这个问题,但你已经尽力了。我真的很感激。谢谢!我很高兴能帮上忙。如果它对你有用的话,你可能会想。
txtUTF <- read.csv(file.choose(), encoding = 'UTF-8')
nouns <- sapply(txtUTF, extractNoun, USE.NAMES = F)