R中的量子问题
我在R中使用Quanteda并创建了语料库和dfm。但是,我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复,我将不胜感激?谢谢您可以尝试明确地提到R中的量子问题,r,text-mining,quanteda,R,Text Mining,Quanteda,我在R中使用Quanteda并创建了语料库和dfm。但是,我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复,我将不胜感激?谢谢您可以尝试明确地提到docid\u字段和text\u字段: data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text") 其中,doc\u id和text是数据框data中的列 然后使用qunateda包的dfm函数计算文档特征矩阵 da
docid\u字段
和text\u字段
:
data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text")
其中,doc\u id
和text
是数据框data
中的列
然后使用qunateda
包的dfm
函数计算文档特征矩阵
data_dfm = dfm(data_corpus)
嘿欢迎来到StackOverflow!请提供一些上下文(例如代码)。如果我们不知道问题的起因,就很难帮助解决问题:p