对于R中的文本挖掘,如何将DocumentTermMatrix与原始数据框结合起来?

对于R中的文本挖掘,如何将DocumentTermMatrix与原始数据框结合起来?,r,nlp,text-mining,R,Nlp,Text Mining,我想做的是创建代码,允许我对推特进行分类。因此,在下面的例子中,我想拿一些关于信用卡的推特来确定它们是否与旅游相关 以下是初始数据集: id<- c(123,124,125,126,127) text<- c("Since I love to travel, this is what I rely on every time.", "I got this card for the no international transaction fee",

我想做的是创建代码,允许我对推特进行分类。因此,在下面的例子中,我想拿一些关于信用卡的推特来确定它们是否与旅游相关

以下是初始数据集:

id<- c(123,124,125,126,127) 
text<- c("Since I love to travel, this is what I rely on every time.", 
        "I got this card for the no international transaction fee", 
        "I got this card mainly for the flight perks",
        "Very good card, easy application process",
        "The customer service is outstanding!") 
travel_cat<- c(1,0,1,0,0) 
df_all<- data.frame(id,text,travel) 
然后,我创建一个仅包含文本字段的数据框,然后进行文本分析:

myvars<- c("text")
df<- df_all[myvars]

library(tm)
corpus<- Corpus(DataframeSource(df))
corpus<- tm_map(corpus, content_transformer(tolower))
corpus<- tm_map(corpus, removePunctuation)
corpus<- tm_map(corpus, removeWords, stopwords("english"))
corpus<- tm_map(corpus, stripWhitespace)
dtm<- as.matrix(DocumentTermMatrix(corpus))
然后如何将其绑定到原始数据,使其包含原始数据集和矩阵中的字段(输出1+输出2): id、文本、旅行\u cat+应用程序、卡、客户、轻松、每…

只需尝试一个
cbind()


allcombined是。。哇,这是一个比我想象的简单得多的解决方案。谢谢
myvars<- c("text")
df<- df_all[myvars]

library(tm)
corpus<- Corpus(DataframeSource(df))
corpus<- tm_map(corpus, content_transformer(tolower))
corpus<- tm_map(corpus, removePunctuation)
corpus<- tm_map(corpus, removeWords, stopwords("english"))
corpus<- tm_map(corpus, stripWhitespace)
dtm<- as.matrix(DocumentTermMatrix(corpus))
Docs    application card    customer    easy    every ... etc.
1       0           0       0           1       0
2       0           1       0           0       1
3       0           1       0           0       0
4       1           1       0           0       0
5       0           0       1           0       0
allcombined <- cbind(dtm,df_all)