Java 使用什么数据挖掘应用程序?

Java 使用什么数据挖掘应用程序?,java,data-mining,Java,Data Mining,我最后用的是 . 我最后一次听说java正在为它开发一个API(JDM)。任何人都可以分享他们使用这些工具的经验。我最感兴趣的是使用这些工具进行分类/聚类(weka在这里做得不错),而且该工具应该有良好的API支持 我使用Weka进行文本分类。很好。天气也很好。一个可以保存数据表示和修改算法的框架的想法非常棒 我们在为分类和聚类开发的一些软件中使用了Weka。我不是数据挖掘方面的专家,但与其他许多产品一起进行评估的团队肯定知道他们的产品,并且通常习惯于使用非常昂贵的现成产品。我正在使用(以前是多

我最后用的是
. 我最后一次听说java正在为它开发一个API(JDM)。任何人都可以分享他们使用这些工具的经验。我最感兴趣的是使用这些工具进行分类/聚类(weka在这里做得不错),而且该工具应该有良好的API支持

我使用Weka进行文本分类。很好。天气也很好。一个可以保存数据表示和修改算法的框架的想法非常棒

我们在为分类和聚类开发的一些软件中使用了Weka。我不是数据挖掘方面的专家,但与其他许多产品一起进行评估的团队肯定知道他们的产品,并且通常习惯于使用非常昂贵的现成产品。

我正在使用(以前是多特蒙德大学的耶鲁)。它是一个基于Java的开源工具,实现了大多数流行的分类器/集群方法。它还附带了为Weka工具包实现的算法,因此有更多的选项。带有一个非常易于使用的GUI和一个基于Java的API。

Weka是一个流行的数据挖掘平台,实现了许多用于分类、聚类等的教科书算法。它非常适合快速原型设计,即快速设置系统并验证它是否达到了预期目的

然而,Weka有两个主要问题。首先,它是根据GPL许可证分发的,这意味着您不能将其作为商业软件包的一部分使用,也不能对其进行修改而不发布更改。此外,Weka的另一个弱点是它不能处理大量数据。如果您的数据无法放入计算机内存中,则说明您有问题


这两个问题都在一揽子计划中得到解决。它相对较新,缺乏一些功能,但根据您遇到的数据挖掘问题,它可能是您的正确选择

根据2007年、2008年和2009年KDnuggets年度民意调查,RapidMiner是全球数据挖掘专家中使用最广泛的开源数据挖掘解决方案:


RapidMiner是开源的,100%Java,RapidMiner比Weka灵活得多,提供了更多的功能。

你真的应该看看Orange数据挖掘工具包。它带有一个拖放gui和一个Python API。

我使用自己用Java开发的软件,专门从事务数据库或序列数据库中挖掘频繁模式和关联规则:


它提供了46种算法,包括一些在任何其他流行的数据挖掘软件中都找不到的算法。有一个GUI版本和一个源代码版本

实际上,你可以在商业软件包中使用GPL许可的东西,只是有一些规定而已。