通过for循环以不同的名称存储多个语料库

通过for循环以不同的名称存储多个语料库,r,for-loop,text-mining,tm,corpus,R,For Loop,Text Mining,Tm,Corpus,我有多个文本文档每个股票我想存储为一个单独的语料库。 我读过关于创建“列表中的列表”的内容,但这对我不起作用。例如,“文本挖掘和termdocumentmatrix”给出以下错误:“termdocumentmatrix”没有适用于“list”类对象的方法 我可能会将所有内容都放在for循环中,但这不是我想要的,因为我需要一些灵活性来处理语料库 有人能帮我解决这个问题吗?我的代码如下。谢谢 Stocks <- list("AAPL", "AMZN", "BIG", "BYD", "CTWS"

我有多个文本文档每个股票我想存储为一个单独的语料库。 我读过关于创建“列表中的列表”的内容,但这对我不起作用。例如,“文本挖掘和termdocumentmatrix”给出以下错误:“termdocumentmatrix”没有适用于“list”类对象的方法

我可能会将所有内容都放在for循环中,但这不是我想要的,因为我需要一些灵活性来处理语料库

有人能帮我解决这个问题吗?我的代码如下。谢谢

Stocks <- list("AAPL", "AMZN", "BIG", "BYD", "CTWS", "EAT", "FB", "GOOG", "GRMC", "HRL", "MGM", "MSFT",
               "NEM", "PKS", "RGLD", "SCCO", "SLP", "TCO", "USGL", "WDFC"
)

BigList <- list()
for (stock in Stocks) {
  filepath <- file.path("C:/Users/......./Stocks10K", stock)
  a <- Corpus(DirSource(filepath))
  a <- tm_map(a, removePunctuation)
  a <- tm_map(a, removeNumbers)
  a <- tm_map(a, tolower)
  a <- tm_map(a, removeWords, stopwords("en"))
  a <- tm_map(a, stripWhitespace)
  name <- paste('Data:', stock, sep='')
  tmp <- list(Text = a)
  BigList[name] <- tmp
  rm(tmp, stock, name, filepath, a)
}

#Create Term Document Matrix and create Matrix
tdm <- TermDocumentMatrix(BigList['Data:AAPL'])
m <- as.matrix(tdm)

Stocks看起来您做的一切都很好,除了从
BigList
[
中获取条目外,您需要
[
返回一个列表(在您的案例中包含一个元素)。请尝试:

tdm <- TermDocumentMatrix(BigList[['Data:AAPL']])

tdm看起来您做的一切都很好,除了从
BigList
[
中获取条目外,它将返回一个列表(在您的案例中包含一个元素)-您需要
[
。请尝试:

tdm <- TermDocumentMatrix(BigList[['Data:AAPL']])

tdm成功了!我知道解决方案不会那么难。将所有内容存储在大列表中肯定有我的偏好,我只是不知道如何正确访问它。谢谢!没问题-很高兴帮助它成功了!我知道解决方案不会那么难。将所有内容存储在大列表中肯定有我的偏好,我只是不知道如何操作正确访问它。谢谢!没问题-很乐意帮助