Open source 数据挖掘开源软件替代方案

Open source 数据挖掘开源软件替代方案,open-source,data-mining,Open Source,Data Mining,我正在评估数据挖掘包。 到目前为止,我已经找到了这两个: 你有没有经验与我分享这两种产品,或者向我推荐其他产品? 谢谢我在高中课程中使用了Weka,它的实现非常好。这是四五年前的事了。对于商业智能来说是个不错的选择。也许你想看看。我在it方面有一些经验,主要是在数据仓库方面,我非常高兴。另一种选择是。它包括各种算法和数据挖掘技术,您可以直接通过Python脚本或GUI进行访问。直接在R中重新发明轮子和代码 根据2007年、2008年和2009年KDnuggets年度民意调查,RapidMin

我正在评估数据挖掘包。
到目前为止,我已经找到了这两个:
  • 你有没有经验与我分享这两种产品,或者向我推荐其他产品?

    谢谢

    我在高中课程中使用了Weka,它的实现非常好。这是四五年前的事了。

    对于商业智能来说是个不错的选择。也许你想看看。我在it方面有一些经验,主要是在数据仓库方面,我非常高兴。

    另一种选择是。它包括各种算法和数据挖掘技术,您可以直接通过Python脚本或GUI进行访问。

    直接在R中重新发明轮子和代码

    根据2007年、2008年和2009年KDnuggets年度民意调查,RapidMiner是全球数据挖掘专家中使用最广泛的开源数据挖掘解决方案:

    RapidMiner是开源和100%Java的,RapidMiner比Weka和KNIME灵活得多,提供的功能也明显更多


    关于SVM实现:Weka附带了一个这样的实现(LibSVM),而RapidMiner提供了四个SVM实现(LibSVM、MySVM、EvoSVM、SMO-SVM),其中一些具有更高级的功能。

    如前所述,Pentaho是Weka所属的强大的商业智能套件


    因此,我也建议使用Weka,只是为了让您拥有一个扩展应用程序的优秀解决方案和一个优秀的社区。

    ()是一个相当广泛的数据挖掘平台。

    根据KDnuggets Poll 2011,RapidMiner再次成为全球使用最广泛的数据挖掘解决方案:

    如果您对与频繁模式挖掘、关联规则和顺序模式挖掘相关的Java代码感兴趣,我有一个小型开源项目,其中包含42个与这些主题相关的算法:


    但是,请注意,它不提供任何用户界面。但它提供了一些在其他数据挖掘软件包中找不到的非常专业的算法。

    看一看,这与WEKA类似,只是它在聚类和离群点检测方面更强,而WEKA基本上只擅长分类。

    看起来Pentaho是WEKA的主要赞助商:不知道这一点。也许我必须重新看待Weka.+1的懒惰、急躁和傲慢。