Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 使用术语列表记录术语矩阵_R_Text_Nlp_Mining - Fatal编程技术网

R 使用术语列表记录术语矩阵

R 使用术语列表记录术语矩阵,r,text,nlp,mining,R,Text,Nlp,Mining,我正在尝试使用预先识别的术语构建文档术语矩阵。语料库在变量cname中标识,带有预先标识的术语的文件被读入术语变量,然后转换为列表。当我运行下面的代码时,我得到一个空的DTM。下面是我正在使用的代码。你知道我做错了什么吗?谢谢你 汤姆 library(tm) 图书馆(Rmpfr) 图书馆(stm) #装载文件 cname我对TM不太熟悉,但在quanteda包中,您可以简单地进行子集或筛选。在这里,同样的原则也应该适用。我认为您应该能够构建DTM,然后简单地根据您感兴趣的术语向量进行过滤。首先按

我正在尝试使用预先识别的术语构建文档术语矩阵。语料库在变量cname中标识,带有预先标识的术语的文件被读入术语变量,然后转换为列表。当我运行下面的代码时,我得到一个空的DTM。下面是我正在使用的代码。你知道我做错了什么吗?谢谢你

汤姆

library(tm)
图书馆(Rmpfr)
图书馆(stm)
#装载文件

cname我对TM不太熟悉,但在quanteda包中,您可以简单地进行子集或筛选。在这里,同样的原则也应该适用。我认为您应该能够构建DTM,然后简单地根据您感兴趣的术语向量进行过滤。首先按照上面的方法制作DTM

v <- ("your","terms","here")
to_filter <- colnames(dtm)

#then you can simply filter based on the vector
dtm2 <- dtm[,to_filter %in% v]

v如果您不介意,请接受答案!谢谢很乐意帮忙。如果你做了很多NLP的东西,你应该看看quanteda软件包。
v <- ("your","terms","here")
to_filter <- colnames(dtm)

#then you can simply filter based on the vector
dtm2 <- dtm[,to_filter %in% v]