R 将数据库输出转换为主题建模的语料库

R 将数据库输出转换为主题建模的语料库,r,lda,topic-modeling,R,Lda,Topic Modeling,我总共有54892份文件。在从数据库中检索它们之后,我应该如何将它们转换为可以使用LDA进行主题建模的语料库 这是我尝试过的代码: library(RMySQL) library(RTextTools) library(topicmodels) library(tm) con <- dbConnect(MySQL(), user="root", password="root", dbname="dbtemp", host="localhost") rs <- dbSendQuery

我总共有54892份文件。在从数据库中检索它们之后,我应该如何将它们转换为可以使用LDA进行主题建模的语料库

这是我尝试过的代码:

library(RMySQL)
library(RTextTools)
library(topicmodels)
library(tm)

con <- dbConnect(MySQL(), user="root", password="root", dbname="dbtemp", host="localhost")
rs <- dbSendQuery(con, "select text_body from all_text;")
data <- fetch(rs, n=54892)
huh <- dbHasCompleted(rs)
dbClearResult(rs)
dbDisconnect(con)

其中
表示0。这看起来像是一个术语文档矩阵,但我仍然想在R中重新制作这样的矩阵。我应该怎么做?

您能更清楚地回答您的问题吗?你在制作语料库方面做了哪些尝试?我第一次在LDA中使用R。为此,我使用了Python-。我有一个市场矩阵语料库。因此,既然您已经做了一些事情(我们无法复制,但您没有显示错误),请提供
str(数据)
str(huh)
返回的内容。否则我们必须做出不受支持的猜测。@RomanLuštrik我已经编辑了这个问题。“我想这可能解释得更好。”我想我已经编辑了这个问题。我想这可以更好地解释。
. . 2 . . . . . . 1 1 . 1 . . 1 . 2 . . . . . . . . . . . . . ......
. 1 . . . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . ......
. . . . . . . . . 1 1 1 . . . 2 . . . . . . . 1 . . 1 . . . . ......
. . 1 . . . 2 . . . . 1 1 . . . . . . . 1 . . . . . . . . . . ......