R语言中最大发生项术语网络的建立

R语言中最大发生项术语网络的建立,r,R,我正在从包含文本数据的文件创建术语网络。我已经成功地创建了网络,但它正在创建一个由文件中的所有单词组成的网络(比如1281个单词)。我想要一个数据文件中出现单词的最大次数网络。 下面是我试过的代码 text<-read.delim(file='check.csv', header=FALSE, stringsAsFactors=FALSE) a <- Corpus(VectorSource(text), readerControl = list(language = "en"))

我正在从包含文本数据的文件创建术语网络。我已经成功地创建了网络,但它正在创建一个由文件中的所有单词组成的网络(比如1281个单词)。我想要一个数据文件中出现单词的最大次数网络。 下面是我试过的代码

text<-read.delim(file='check.csv', header=FALSE, stringsAsFactors=FALSE)
a <- Corpus(VectorSource(text), readerControl = list(language = "en"))

a <- tm_map(a, removeNumbers)
a<- tm_map(a, gsub, pattern=",", replacement=" ")
a <- tm_map(a, removePunctuation)
a <- tm_map(a , stripWhitespace)
a <- tm_map(a, tolower)
a <- tm_map(a, removeWords, stopwords("english")) 
a <- tm_map(a, removeWords, c("cox","can","cant","get","set") )



newtext <- lapply(a, function(x){
  x <- Corpus(VectorSource(x))
  x1 <- x
  x <- tm_map(x, stemDocument, language = "english")
  x <- tm_map(x, stemCompletion, dictionary=x1)  
} 
)
newtext1 <- Corpus(VectorSource(newtext))
tdm <- TermDocumentMatrix(newtext1)
termDocMatrix<-tdm
termDocMatrix<-as.matrix(termDocMatrix)
termMatrix<-termDocMatrix %*% t(termDocMatrix) # term-term adjacency matrix
library(igraph)
g <- graph.adjacency(termMatrix, weighted=T, mode="undirected")
g <- simplify(g) # remove loops
V(g)$name
V(g)$label <- V(g)$name
V(g)$degree <- degree(g)
set.seed(3952)
layout1 <- layout.fruchterman.reingold(g)
plot.new()
plot(g, layout=layout1)

text请提供使用的软件包-
Corpus
tm\u map
,以及此处未定义的其他功能。更重要的是,这段代码的哪一部分应该按频率过滤单词?ok@CarlWitthoft library(tm)library(ggplot2)library(RColorBrewer)我使用过的这些软件包。事实上,我想要的是那些在文件中出现的单词。我只想把这些术语组成一个网络。