如何使用tm从R中的DocumentTermMatrix中选择命名列

如何使用tm从R中的DocumentTermMatrix中选择命名列,r,tm,R,Tm,我已经编写了使用“tm”包在R中生成文档术语矩阵的代码 现在,我必须只为选定的命名列选择矩阵中的频率值。因此,我想根据一系列术语对矩阵进行子集划分。如果任何术语(如terms=c('medium'、'high'、'low')在文档术语矩阵中作为列出现,我只希望这些列出现在输出矩阵中 该方法是什么?R中的代码是如何为此编写的 我查看了文档术语矩阵,它包含I、j和v的值 你可以这样做 library(tm) data("crude") dtm <- DocumentTermMatrix(cru

我已经编写了使用“tm”包在R中生成文档术语矩阵的代码

现在,我必须只为选定的命名列选择矩阵中的频率值。因此,我想根据一系列术语对矩阵进行子集划分。如果任何术语(如terms=c('medium'、'high'、'low')在文档术语矩阵中作为列出现,我只希望这些列出现在输出矩阵中

该方法是什么?R中的代码是如何为此编写的


我查看了文档术语矩阵,它包含I、j和v的值

你可以这样做

library(tm)
data("crude")
dtm <- DocumentTermMatrix(crude)
terms <- c('medium', 'high', 'low')
inspect(dtm[1:5, intersect(colnames(dtm), terms)])
# <<DocumentTermMatrix (documents: 5, terms: 2)>>
#   Non-/sparse entries: 0/10
# Sparsity           : 100%
# Maximal term length: 4
# Weighting          : term frequency (tf)
# 
# Terms
# Docs  high low
# 127    0   0
# 144    0   0
# 191    0   0
# 194    0   0
# 211    0   0
library(tm)
数据(“原油”)

你可以这样做

library(tm)
data("crude")
dtm <- DocumentTermMatrix(crude)
terms <- c('medium', 'high', 'low')
inspect(dtm[1:5, intersect(colnames(dtm), terms)])
# <<DocumentTermMatrix (documents: 5, terms: 2)>>
#   Non-/sparse entries: 0/10
# Sparsity           : 100%
# Maximal term length: 4
# Weighting          : term frequency (tf)
# 
# Terms
# Docs  high low
# 127    0   0
# 144    0   0
# 191    0   0
# 194    0   0
# 211    0   0
library(tm)
数据(“原油”)
数字地面模型