Java 如何将hashmap数据写入arff文件

Java 如何将hashmap数据写入arff文件,java,cluster-analysis,weka,arff,Java,Cluster Analysis,Weka,Arff,我想根据教育领域收集简历 因此,我将简历(CV)从非结构化格式转换为半结构化格式,并从教育标签中获取数据 <education>data data data</education> 然后,我将这些数据转换为向量空间模型,并将其存储在散列图上(取决于简历中每个术语的占用情况,即输入或输出) 现在我想对这些数据进行聚类,每个简历都包含一个字段,使其位于同一个集群中,例如,Art简历位于同一个集群中 我读到了有关用来对数据进行聚类的Weka的文章。然而,Weka只支持arff

我想根据教育领域收集简历 因此,我将简历(CV)从非结构化格式转换为半结构化格式,并从教育标签中获取数据

<education>data data data</education>
然后,我将这些数据转换为向量空间模型,并将其存储在散列图上(取决于简历中每个术语的占用情况,即输入或输出)

现在我想对这些数据进行聚类,每个简历都包含一个字段,使其位于同一个集群中,例如,Art简历位于同一个集群中

我读到了有关用来对数据进行聚类的Weka的文章。然而,Weka只支持
arff
输入格式。 我怎样才能将存储在arff文件的hashmap中的数据写入呢??!! Weka如何计算数字数据,即(简历中出现的术语)来聚类文本数据,即(简历名称)?!! 对不起,如果我的问题是胡说八道,但我是全新的韦卡我希望你能帮助我

编辑 我将数据写入arff文件(仅矢量数据),最后在阅读了stack overFlow中的几个问题后,我现在能够使用WEKA,并应用
SimpleMeans
集群和我的输出

Instance 1 -> Cluster 4 
Instance 2 -> Cluster 0 
Instance 3 -> Cluster 0 
Instance 4 -> Cluster 0 
Instance 5 -> Cluster 0 
Instance 6 -> Cluster 0 
Instance 7 -> Cluster 3 
Instance 8 -> Cluster 0 
Instance 9 -> Cluster 2 
Instance 10 -> Cluster 4
我的新问题是

我不想查看实例,而是想显示简历的名称
如果我将简历名称作为向量数据之外的属性写入,我是否可以查看简历名称而不是实例#??如果是,我该怎么做呢?

将这些数据写入arff文件的问题在哪里?嗯,是的,你可以这么说。。。。我想写我存储在散列图中的数据(每个简历都有它的向量)是的,所以:做吧!ARFF是一种文本格式,您可以像编写文本文件一样编写它-而且您确实知道如何编写文本文件?是的,我从这里了解到了它。。。。但是我是否也应该将简历的名称作为一个属性来写,这样数据将如下
0.6,0.1,0.0,0.5,resume\u name
!!因为我想对我的数据进行聚类,这样输出将是
cluster1:CV1,CV2。。。。集群2 CV4、CV7等,但集群alg。会用数字数据吗?!!
resume1  [1, 0, 1]
resume2 [0, 1, 1]
Instance 1 -> Cluster 4 
Instance 2 -> Cluster 0 
Instance 3 -> Cluster 0 
Instance 4 -> Cluster 0 
Instance 5 -> Cluster 0 
Instance 6 -> Cluster 0 
Instance 7 -> Cluster 3 
Instance 8 -> Cluster 0 
Instance 9 -> Cluster 2 
Instance 10 -> Cluster 4