R:循环替换语料库上的同义词时出错
我对R非常陌生。使用TM包,我试图通过替换同义词来清理一组txt文档。 由于我将处理大量数据,我尝试使用excel设置一个表,其中第一列中的单词将替换为第二列中的单词,并执行循环以替换语料库中的单词。我的代码如下所示:R:循环替换语料库上的同义词时出错,r,loops,corpus,R,Loops,Corpus,我对R非常陌生。使用TM包,我试图通过替换同义词来清理一组txt文档。 由于我将处理大量数据,我尝试使用excel设置一个表,其中第一列中的单词将替换为第二列中的单词,并执行循环以替换语料库中的单词。我的代码如下所示: library(tm) docs <- Corpus(DirSource("C:....txt files")) list <- read.csv("C:\\.....synonyms list.csv", header=F) for(s in 1:length(d
library(tm)
docs <- Corpus(DirSource("C:....txt files"))
list <- read.csv("C:\\.....synonyms list.csv", header=F)
for(s in 1:length(docs)){
for(x in 1:nrow(list)){
docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]])
}
}
library(tm)
docs也许可以代替docs[[s]]$content尝试给出一个可复制的示例,并避免使用list
作为变量名<代码>列表
通常用于创建一个列表
,您使用它来命名一个数据.frame
,这很容易混淆。