获取R/Java(MOA)聚类算法结果并用python处理它们的更好方法

获取R/Java(MOA)聚类算法结果并用python处理它们的更好方法,java,python,r,cluster-analysis,integration,Java,Python,R,Cluster Analysis,Integration,我一直使用Python进行集群,但最近我遇到了一种情况,我需要CluStream和DenStream(流集群算法)的实现,这两种算法都可以在R和Java中找到(社区中有一些Python实现,但我已经尝试过了,但没有效果) 问题是,我必须比较许多用Python编写的聚类算法,作为前一个阶段,我使用了著名的scikit学习数据集(展示算法如何处理非球状聚类-当然,然后我将使用时间序列数据) 现在,我想知道尝试这些R/Java算法并使用R/Java集群结果计算用Python编码的度量的正确方法是什么

我一直使用Python进行集群,但最近我遇到了一种情况,我需要CluStreamDenStream(流集群算法)的实现,这两种算法都可以在RJava中找到(社区中有一些Python实现,但我已经尝试过了,但没有效果)

问题是,我必须比较许多用Python编写的聚类算法,作为前一个阶段,我使用了著名的scikit学习数据集(展示算法如何处理非球状聚类-当然,然后我将使用时间序列数据)

现在,我想知道尝试这些R/Java算法并使用R/Java集群结果计算用Python编码的度量的正确方法是什么

-->总之,我需要比较使用相同数据集(我认为可以保存到csv文件中)和计算相同有效性度量(Python)的许多算法(用Python和R/Java编码)。

任何帮助都将不胜感激。提前感谢


编辑:我遇到的解决方案如下:

  • 使用sklearn生成玩具数据集,并将其保存到csv文件中
  • 对这些数据集使用不同的聚类算法,并将聚类结果保存到csv文件中(无论使用哪种编程语言)
  • 开发另一个应用程序:
    • 获取存储在cvs文件中的群集解决方案
    • 计算度量并显示结果
如果您找到更好的解决方案,请告诉我


注释

  • 这个R软件包是我想尝试的:
  • 我对R一无所知,我以前也使用过Java(我选择什么实现取决于与Python集成的更好方法)
  • MOA是一个Java软件。除非你已经在R生态系统中(你不是),否则没有理由通过R使用它

  • 您可以将数据写入CSV并加载到您喜欢的任何工具中

  • 这些数据集不是流。它们缺少流的所有困难和挑战-一个简单的子样本就足以确定聚类结构。从这些数据中得出的结论是无用的。使用真实的数据流,而不是没有顺序的合成数据


  • 检查感谢您的回答!是的,经过一些休息后,我注意到我可以将数据集持久化到csv文件中,我做到了。现在,由于我必须使用Python编码的度量来比较结果,我必须决定如何处理所提到的实现(R与Java)最后,我想提一下,这些玩具数据集将用于显示该算法可以处理非球状星团;然后,我将使用真实的流。谢谢!