R中的量子问题_R_Text Mining_Quanteda

R中的量子问题

R中的量子问题,r,text-mining,quanteda,R,Text Mining,Quanteda,我在R中使用Quanteda并创建了语料库和dfm。但是，我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复，我将不胜感激？谢谢您可以尝试明确地提到docid\u字段和text\u字段： data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text") 其中，doc\u id和text是数据框data中的列然后使用qunateda包的dfm函数计算文档特征矩阵 da

我在R中使用Quanteda并创建了语料库和dfm。但是，我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复，我将不胜感激？谢谢

您可以尝试明确地提到

docid\u字段

和

text\u字段

：

data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text")

其中，

doc\u id

和

text

是数据框

data

中的列

然后使用

qunateda

包的

dfm

函数计算文档特征矩阵

data_dfm = dfm(data_corpus)

嘿欢迎来到StackOverflow！请提供一些上下文（例如代码）。如果我们不知道问题的起因，就很难帮助解决问题：p