R 重命名术语文档矩阵中的术语

R 重命名术语文档矩阵中的术语,r,text,tm,mining,R,Text,Tm,Mining,我刚刚在R中创建了一个术语文档矩阵,但现在我想重命名一些术语 举个例子 vector <- "This is a test." library(tm) doc.vec <- VectorSource(vector) doc.corpus <- Corpus(doc.vec) TDM <- TermDocumentMatrix(doc.corpus) 现在我想将例如“test.”重命名为“anything”。原因是,当我挖掘我的文本时,有像“大数据”这样的词,它们显

我刚刚在R中创建了一个术语文档矩阵,但现在我想重命名一些术语

举个例子

vector <- "This is a test."

library(tm)

doc.vec <- VectorSource(vector)
doc.corpus <- Corpus(doc.vec)

TDM <- TermDocumentMatrix(doc.corpus)
现在我想将例如“test.”重命名为“anything”。原因是,当我挖掘我的文本时,有像“大数据”这样的词,它们显然属于同一类。因此,在第一步中,我使用gsub将“大数据”替换为“大数据”。然而,最后,我希望他们的输出是“大数据”


Thx提前提供帮助。

这里有一种方法,不是回答您的第一个问题,而是解决您所说的您的需要:

vector <- "This is a test.  I use big data.  That's George Washington!"

library(tm)
library(qdap)

vector2 <- space_fill(vector, c("big data", "George Washington"))

doc.vec <- VectorSource(vector2)
doc.corpus <- Corpus(doc.vec)

TDM <- TermDocumentMatrix(doc.corpus)
rownames(TDM) <- gsub("~~", " ", rownames(TDM))
inspect(TDM)

                    Docs
Terms                1
  big data.          1
  george washington! 1
  test.              1
  that's             1
  this               1
  use                1
向量
vector <- "This is a test.  I use big data.  That's George Washington!"

library(tm)
library(qdap)

vector2 <- space_fill(vector, c("big data", "George Washington"))

doc.vec <- VectorSource(vector2)
doc.corpus <- Corpus(doc.vec)

TDM <- TermDocumentMatrix(doc.corpus)
rownames(TDM) <- gsub("~~", " ", rownames(TDM))
inspect(TDM)

                    Docs
Terms                1
  big data.          1
  george washington! 1
  test.              1
  that's             1
  this               1
  use                1