将数据从R中的2个目录加载到语料库
我使用R中的tm软件包对数据集执行文本挖掘,其结构如下: 有一个目录组_Data,它包含两个不同的目录,分别名为B和C。现在,目录B包含文档,目录C也包含文档 我知道如何通过创建2个语料库分别加载目录B和C的数据:将数据从R中的2个目录加载到语料库,r,text-mining,tm,R,Text Mining,Tm,我使用R中的tm软件包对数据集执行文本挖掘,其结构如下: 有一个目录组_Data,它包含两个不同的目录,分别名为B和C。现在,目录B包含文档,目录C也包含文档 我知道如何通过创建2个语料库分别加载目录B和C的数据: library(tm) pathToB = "group_Data/B" pathToC = "group_Data/C" bCorpus = Corpus(DirSource(pathToB), readerControl = list(read
library(tm)
pathToB = "group_Data/B"
pathToC = "group_Data/C"
bCorpus = Corpus(DirSource(pathToB),
readerControl = list(reader = readPlain))
cCorpus = Corpus(DirSource(pathToC),
readerControl = list(reader = readPlain))
length(bCorpus)
length(cCorpus)
但我需要将B和C中的数据加载到单个语料库中。
这就是我所尝试的:
pathToBAndC = "group_Data"
corpusBC = Corpus(DirSource(pathToBAndC),
readerControl = list(reader = readPlain))
运行下面提到的length命令时,它给出0
length(corpusBC)
有人能指出,如果我在语料库方法中遗漏了一个选项,可以帮我做到这一点吗?你可以将语料库与
corpusBC <- c(bCorpus, cCorpus)
corpusBC <- Corpus(DirSource(c(pathToB, pathToC)),
readerControl = list(reader = readPlain))