获取R/Java(MOA)聚类算法结果并用python处理它们的更好方法
我一直使用Python进行集群,但最近我遇到了一种情况,我需要CluStream和DenStream(流集群算法)的实现,这两种算法都可以在R和Java中找到(社区中有一些Python实现,但我已经尝试过了,但没有效果) 问题是,我必须比较许多用Python编写的聚类算法,作为前一个阶段,我使用了著名的scikit学习数据集(展示算法如何处理非球状聚类-当然,然后我将使用时间序列数据) 现在,我想知道尝试这些R/Java算法并使用R/Java集群结果计算用Python编码的度量的正确方法是什么 -->总之,我需要比较使用相同数据集(我认为可以保存到csv文件中)和计算相同有效性度量(Python)的许多算法(用Python和R/Java编码)。 任何帮助都将不胜感激。提前感谢获取R/Java(MOA)聚类算法结果并用python处理它们的更好方法,java,python,r,cluster-analysis,integration,Java,Python,R,Cluster Analysis,Integration,我一直使用Python进行集群,但最近我遇到了一种情况,我需要CluStream和DenStream(流集群算法)的实现,这两种算法都可以在R和Java中找到(社区中有一些Python实现,但我已经尝试过了,但没有效果) 问题是,我必须比较许多用Python编写的聚类算法,作为前一个阶段,我使用了著名的scikit学习数据集(展示算法如何处理非球状聚类-当然,然后我将使用时间序列数据) 现在,我想知道尝试这些R/Java算法并使用R/Java集群结果计算用Python编码的度量的正确方法是什么
编辑:我遇到的解决方案如下:
- 使用sklearn生成玩具数据集,并将其保存到csv文件中
- 对这些数据集使用不同的聚类算法,并将聚类结果保存到csv文件中(无论使用哪种编程语言)
- 开发另一个应用程序:
- 获取存储在cvs文件中的群集解决方案
- 计算度量并显示结果
注释:
- 这个R软件包是我想尝试的:
- 我对R一无所知,我以前也使用过Java(我选择什么实现取决于与Python集成的更好方法)
检查感谢您的回答!是的,经过一些休息后,我注意到我可以将数据集持久化到csv文件中,我做到了。现在,由于我必须使用Python编码的度量来比较结果,我必须决定如何处理所提到的实现(R与Java)最后,我想提一下,这些玩具数据集将用于显示该算法可以处理非球状星团;然后,我将使用真实的流。谢谢!