Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在R中使用tm包清理dataframe中的列_R_String_Tm - Fatal编程技术网

在R中使用tm包清理dataframe中的列

在R中使用tm包清理dataframe中的列,r,string,tm,R,String,Tm,我希望使用tm软件包对数据框的列进行更改,即我希望在数据框的列上应用content_transformer、Remove标点符号等功能 例如,使用下面的数据帧 df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!")) 是否有专门使用tm软件包中的功能执行上述操作的方法?要使用tm软件包,以下是一个示例: df <- data.frame(a=c("I love TEXTMINING","Here I GO, Ag

我希望使用tm软件包对数据框的列进行更改,即我希望在数据框的列上应用content_transformer、Remove标点符号等功能

例如,使用下面的数据帧

df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))

是否有专门使用tm软件包中的功能执行上述操作的方法?

要使用tm软件包,以下是一个示例:

df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))

library(tm)
corpus<-Corpus(VectorSource(df$a))
corpus<-tm_map(corpus, removeNumbers)
corpus<-tm_map(corpus, content_transformer(tolower))
#corpus<-tm_map(corpus, removeWords, stopwords('english'))
corpus<-tm_map(corpus, removePunctuation)

answer<-unlist(as.list(corpus))
answer

df使用tm软件包的示例如下:

df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))

library(tm)
corpus<-Corpus(VectorSource(df$a))
corpus<-tm_map(corpus, removeNumbers)
corpus<-tm_map(corpus, content_transformer(tolower))
#corpus<-tm_map(corpus, removeWords, stopwords('english'))
corpus<-tm_map(corpus, removePunctuation)

answer<-unlist(as.list(corpus))
answer

df你可以试试regex
df$a你可以试试regex
df$a谢谢。如果我想将答案附加到df的新列,该怎么办。我在这里找到了答案:谢谢。如果我想将答案附加到df的新列,该怎么办。这是怎么回事?我在这里找到了答案: