Java 如何从Weka中获取术语频率值?

Java 如何从Weka中获取术语频率值?,java,nlp,weka,Java,Nlp,Weka,我正在使用StringToWordVector使用tweets生成TDM。以下是运行StringToOrdVector过滤器后的实例输出 @data {0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 1,10 1,11 1,15 1,16 1,29 1,30 1,31 1,35 1,36 } {17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,32 1,3} {12 1,13 1,14 1,4

我正在使用StringToWordVector使用tweets生成TDM。以下是运行StringToOrdVector过滤器后的实例输出

@data

{0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 1,10 1,11 1,15 1,16 1,29 1,30 1,31 1,35 1,36 }

{17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,32 1,3}

{12 1,13 1,14 1,41 1,42 1,43 1,50 1,51 2,52 1,63 1,64 1,65 1,72 1,73 1,74 1,83 1,84 }
如何获得术语频率值


谢谢。

这是稀疏ARFF数据部分,非零属性通过属性编号及其所述值(值为术语频率)明确标识。每个实例都用大括号括起来,每个条目的格式为:其中index是属性索引(从0开始)。您可以在此处了解更多信息:

谢谢。是否可以在数据集中的所有实例中获取此术语频率的计数?换句话说,我想知道索引pos 3标识的属性在数据集中出现了多少次?