Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/lua/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中的量子问题_R_Text Mining_Quanteda - Fatal编程技术网

R中的量子问题

R中的量子问题,r,text-mining,quanteda,R,Text Mining,Quanteda,我在R中使用Quanteda并创建了语料库和dfm。但是,我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复,我将不胜感激?谢谢您可以尝试明确地提到docid\u字段和text\u字段: data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text") 其中,doc\u id和text是数据框data中的列 然后使用qunateda包的dfm函数计算文档特征矩阵 da

我在R中使用Quanteda并创建了语料库和dfm。但是,我注意到dfm和语料库包含的文档比原始文件少。如果有人能告诉我为什么会发生这种情况以及如何修复,我将不胜感激?谢谢

您可以尝试明确地提到
docid\u字段
text\u字段

data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text")
其中,
doc\u id
text
是数据框
data
中的列

然后使用
qunateda
包的
dfm
函数计算文档特征矩阵

data_dfm = dfm(data_corpus)

嘿欢迎来到StackOverflow!请提供一些上下文(例如代码)。如果我们不知道问题的起因,就很难帮助解决问题:p