Java 如何将hashmap数据写入arff文件_Java_Cluster Analysis_Weka_Arff

Java 如何将hashmap数据写入arff文件

java

Java 如何将hashmap数据写入arff文件,java,cluster-analysis,weka,arff,Java,Cluster Analysis,Weka,Arff,我想根据教育领域收集简历因此，我将简历（CV）从非结构化格式转换为半结构化格式，并从教育标签中获取数据 <education>data data data</education> 然后，我将这些数据转换为向量空间模型，并将其存储在散列图上（取决于简历中每个术语的占用情况，即输入或输出）现在我想对这些数据进行聚类，每个简历都包含一个字段，使其位于同一个集群中，例如，Art简历位于同一个集群中我读到了有关用来对数据进行聚类的Weka的文章。然而，Weka只支持arff

我想根据教育领域收集简历因此，我将简历（CV）从非结构化格式转换为半结构化格式，并从教育标签中获取数据

<education>data data data</education>

然后，我将这些数据转换为向量空间模型，并将其存储在散列图上（取决于简历中每个术语的占用情况，即输入或输出）

现在我想对这些数据进行聚类，每个简历都包含一个字段，使其位于同一个集群中，例如，Art简历位于同一个集群中

我读到了有关用来对数据进行聚类的Weka的文章。然而，Weka只支持

arff

输入格式。我怎样才能将存储在arff文件的hashmap中的数据写入呢？？！！ Weka如何计算数字数据，即（简历中出现的术语）来聚类文本数据，即（简历名称）？！！对不起，如果我的问题是胡说八道，但我是全新的韦卡我希望你能帮助我

编辑我将数据写入arff文件（仅矢量数据），最后在阅读了stack overFlow中的几个问题后，我现在能够使用WEKA，并应用

SimpleMeans

集群和我的输出

Instance 1 -> Cluster 4 
Instance 2 -> Cluster 0 
Instance 3 -> Cluster 0 
Instance 4 -> Cluster 0 
Instance 5 -> Cluster 0 
Instance 6 -> Cluster 0 
Instance 7 -> Cluster 3 
Instance 8 -> Cluster 0 
Instance 9 -> Cluster 2 
Instance 10 -> Cluster 4

我的新问题是

我不想查看实例，而是想显示简历的名称

如果我将简历名称作为向量数据之外的属性写入，我是否可以查看简历名称而不是实例#？？如果是，我该怎么做呢？

将这些数据写入arff文件的问题在哪里？嗯，是的，你可以这么说。。。。我想写我存储在散列图中的数据（每个简历都有它的向量）是的，所以：做吧！ARFF是一种文本格式，您可以像编写文本文件一样编写它-而且您确实知道如何编写文本文件？是的，我从这里了解到了它。。。。但是我是否也应该将简历的名称作为一个属性来写，这样数据将如下

0.6,0.1,0.0,0.5，resume\u name

！！因为我想对我的数据进行聚类，这样输出将是

cluster1:CV1，CV2。。。。集群2 CV4、CV7等，但集群alg。会用数字数据吗？！！
resume1  [1, 0, 1]
resume2 [0, 1, 1]

Instance 1 -> Cluster 4 
Instance 2 -> Cluster 0 
Instance 3 -> Cluster 0 
Instance 4 -> Cluster 0 
Instance 5 -> Cluster 0 
Instance 6 -> Cluster 0 
Instance 7 -> Cluster 3 
Instance 8 -> Cluster 0 
Instance 9 -> Cluster 2 
Instance 10 -> Cluster 4