在R中使用tm包清理dataframe中的列
我希望使用tm软件包对数据框的列进行更改,即我希望在数据框的列上应用content_transformer、Remove标点符号等功能 例如,使用下面的数据帧在R中使用tm包清理dataframe中的列,r,string,tm,R,String,Tm,我希望使用tm软件包对数据框的列进行更改,即我希望在数据框的列上应用content_transformer、Remove标点符号等功能 例如,使用下面的数据帧 df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!")) 是否有专门使用tm软件包中的功能执行上述操作的方法?要使用tm软件包,以下是一个示例: df <- data.frame(a=c("I love TEXTMINING","Here I GO, Ag
df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))
是否有专门使用tm软件包中的功能执行上述操作的方法?要使用tm软件包,以下是一个示例:
df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))
library(tm)
corpus<-Corpus(VectorSource(df$a))
corpus<-tm_map(corpus, removeNumbers)
corpus<-tm_map(corpus, content_transformer(tolower))
#corpus<-tm_map(corpus, removeWords, stopwords('english'))
corpus<-tm_map(corpus, removePunctuation)
answer<-unlist(as.list(corpus))
answer
df使用tm软件包的示例如下:
df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))
library(tm)
corpus<-Corpus(VectorSource(df$a))
corpus<-tm_map(corpus, removeNumbers)
corpus<-tm_map(corpus, content_transformer(tolower))
#corpus<-tm_map(corpus, removeWords, stopwords('english'))
corpus<-tm_map(corpus, removePunctuation)
answer<-unlist(as.list(corpus))
answer
df你可以试试regexdf$a你可以试试regexdf$a谢谢。如果我想将答案附加到df的新列,该怎么办。我在这里找到了答案:谢谢。如果我想将答案附加到df的新列,该怎么办。这是怎么回事?我在这里找到了答案: