R 创建Bi图的术语文档矩阵?

R 创建Bi图的术语文档矩阵?,r,matrix,nlp,text-mining,term-document-matrix,R,Matrix,Nlp,Text Mining,Term Document Matrix,我正在大数据集上进行文本挖掘。我能够创建TDM和DTM,并能够使用TDF和IDF执行分析。但是我们可以为R中的Bi图创建一个术语文档矩阵或文档术语矩阵吗?我知道Mahout中也有类似的设施,但我正在寻找一种在R中实现这一点的方法?以下代码对我很有用: BigramTokenizer <- function(x) {RWeka::NGramTokenizer(x, RWeka::Weka_control(min = 2, max = 2))} myTdm <- TermDocument

我正在大数据集上进行文本挖掘。我能够创建TDM和DTM,并能够使用TDF和IDF执行分析。但是我们可以为R中的Bi图创建一个术语文档矩阵或文档术语矩阵吗?我知道Mahout中也有类似的设施,但我正在寻找一种在R中实现这一点的方法?

以下代码对我很有用:

BigramTokenizer <- function(x) {RWeka::NGramTokenizer(x, RWeka::Weka_control(min = 2, max = 2))}
myTdm <- TermDocumentMatrix(myCorpus, control = list(tokenize = BigramTokenizer))
BigramTokenizer