语料库无法正确阅读R中的文本
我正在使用“tm”R软件包对一个小的推特数据集进行分析。数据位于csv文件中,包含一些元数据和tweet本身,如下所示:语料库无法正确阅读R中的文本,r,twitter,corpus,R,Twitter,Corpus,我正在使用“tm”R软件包对一个小的推特数据集进行分析。数据位于csv文件中,包含一些元数据和tweet本身,如下所示: 24614259216,RT@victoriavaneyk:Bitcoin正被非洲移民工人用来寄钱回家#比特币http://t.co/z0Lkm2ncUw,2.9690174302789387 我将文件读入数据框,并尝试从中构建语料库: data <- read.csv(file, header=TRUE) corpus <- Corpus(DataframeSo
24614259216,RT@victoriavaneyk:Bitcoin正被非洲移民工人用来寄钱回家#比特币http://t.co/z0Lkm2ncUw,2.9690174302789387
我将文件读入数据框,并尝试从中构建语料库:
data <- read.csv(file, header=TRUE)
corpus <- Corpus(DataframeSource(data))
数据数据尝试数据,谢谢!您应该添加额外的信息来解释它的作用。
> inspect(corpus[1])
<<VCorpus (documents: 1, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
2461
1425999216
2940
2.96901743027894