r tm在排序操作后提取文档ID
我对这个问题没有任何想法。我正在从r tm在排序操作后提取文档ID,r,tm,R,Tm,我对这个问题没有任何想法。我正在从tm::dtm中提取最频繁的单词,如下所示: > s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE) 但是文档ID和行和在一个元组中 > s1[2] 429 875 其中429为单据id,行和为875。我不再使用行和,如何获得已排序文档ID的列表?我正在寻找向量输出,如: 290 429 318 125 128 425 431 153 52 385 144 491 126 42
tm::dtm
中提取最频繁的单词,如下所示:
> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)
但是文档ID和行和
在一个元组中
> s1[2]
429
875
其中429为单据id,行和为875。我不再使用行和
,如何获得已排序文档ID的列表?我正在寻找向量输出,如:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
非常感谢。
s1
是一个命名向量,名称为290、429、318等,值为916875、860等
要仅提取s1
的名称,我们可以使用
names(s1)
这将使:
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
你在找名字(s1)?是的,就是这样。如果你想要业力积分,请将此作为答案发布。另一方面,早些时候,当我需要统计数据(行和)时,我会使用As.vector(s1)。“这里有捷径吗?”补充道,这是一个带有解释的答案。如果还不清楚,请告诉我。
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391