R 重命名术语文档矩阵中的术语
我刚刚在R中创建了一个术语文档矩阵,但现在我想重命名一些术语 举个例子R 重命名术语文档矩阵中的术语,r,text,tm,mining,R,Text,Tm,Mining,我刚刚在R中创建了一个术语文档矩阵,但现在我想重命名一些术语 举个例子 vector <- "This is a test." library(tm) doc.vec <- VectorSource(vector) doc.corpus <- Corpus(doc.vec) TDM <- TermDocumentMatrix(doc.corpus) 现在我想将例如“test.”重命名为“anything”。原因是,当我挖掘我的文本时,有像“大数据”这样的词,它们显
vector <- "This is a test."
library(tm)
doc.vec <- VectorSource(vector)
doc.corpus <- Corpus(doc.vec)
TDM <- TermDocumentMatrix(doc.corpus)
现在我想将例如“test.”重命名为“anything”。原因是,当我挖掘我的文本时,有像“大数据”这样的词,它们显然属于同一类。因此,在第一步中,我使用gsub将“大数据”替换为“大数据”。然而,最后,我希望他们的输出是“大数据”
Thx提前提供帮助。这里有一种方法,不是回答您的第一个问题,而是解决您所说的您的需要:
vector <- "This is a test. I use big data. That's George Washington!"
library(tm)
library(qdap)
vector2 <- space_fill(vector, c("big data", "George Washington"))
doc.vec <- VectorSource(vector2)
doc.corpus <- Corpus(doc.vec)
TDM <- TermDocumentMatrix(doc.corpus)
rownames(TDM) <- gsub("~~", " ", rownames(TDM))
inspect(TDM)
Docs
Terms 1
big data. 1
george washington! 1
test. 1
that's 1
this 1
use 1
向量
vector <- "This is a test. I use big data. That's George Washington!"
library(tm)
library(qdap)
vector2 <- space_fill(vector, c("big data", "George Washington"))
doc.vec <- VectorSource(vector2)
doc.corpus <- Corpus(doc.vec)
TDM <- TermDocumentMatrix(doc.corpus)
rownames(TDM) <- gsub("~~", " ", rownames(TDM))
inspect(TDM)
Docs
Terms 1
big data. 1
george washington! 1
test. 1
that's 1
this 1
use 1