在从文件加载的字上使用R中tm_映射中的RemoveWords

在从文件加载的字上使用R中tm_映射中的RemoveWords,r,tm,R,Tm,在R的tm_map包中,我看到了一些关于使用removewords函数从语料库中删除stopwords()或硬编码单词的问题。但是,我正在尝试删除存储在文件中的单词(当前为csv,但我不在乎是哪种类型)。使用下面的代码,我没有得到任何错误,但我的话仍然存在。有人能解释一下怎么了吗 #install.packages('tm') library(tm) setwd("c://Users//towens101317//Desktop") problem_statements <- read

在R的
tm_map
包中,我看到了一些关于使用
removewords
函数从语料库中删除
stopwords()
或硬编码单词的问题。但是,我正在尝试删除存储在文件中的单词(当前为csv,但我不在乎是哪种类型)。使用下面的代码,我没有得到任何错误,但我的话仍然存在。有人能解释一下怎么了吗

#install.packages('tm')
library(tm)

setwd("c://Users//towens101317//Desktop")

problem_statements <- read.csv("query_export_results_100.csv", stringsAsFactors = FALSE, header = TRUE)
problem_statements_text <- paste(problem_statements, collapse=" ")
problem_statements_source <- VectorSource(problem_statements_text)

my_stop_words <- read.csv("mystopwords.csv", stringsAsFactors=FALSE, header = TRUE)
my_stop_words_text <- paste(my_stop_words, collapse=" ")

corpus <- Corpus(problem_statements_source)
corpus <- tm_map(corpus, removeWords, my_stop_words_text)

dtm <- DocumentTermMatrix(corpus)
dtm2 <- as.matrix(dtm)

frequency <- colSums(dtm2)
frequency <- sort(frequency, decreasing=TRUE)

head(frequency)
#install.packages('tm'))
图书馆(tm)
setwd(“c://Users//towens101317//Desktop”)

问题陈述你能在tm地图行之前添加一个对inspect(语料库)的调用吗?这样我们就可以看到你的语料库是什么样子了?难道
语料库中的最后一个参数不应该吗?问题是read.csv()创建了一个表,但我需要一个向量。函数的作用是:。我像这样改变了我的阅读声明,它成功了