要有效地使用Hadoop和Mahout,需要多少Java?

要有效地使用Hadoop和Mahout,需要多少Java?,java,php,hadoop,mahout,Java,Php,Hadoop,Mahout,我是一名PHP开发人员。我们现在就把它放一边吧。但是Hadoop,尤其是Mahout,激起了我的兴趣。为了使用它们,我准备深入Java 因此,从人们的经验来看,我需要多少Java才能有效地使用这些工具?从我所看到的来看,编程映射器/还原器并不需要那么多。但是对于Mahout,当我查看文档时,我根本不确定我在看什么 另外,通过Hadoop和Mahout从我的PHP应用程序中获取数据以进行Java处理有多难?我无法想象会有那么难,但我没有足够的经验来说明这一点。使用Mahout和Hadoop从PHP

我是一名PHP开发人员。我们现在就把它放一边吧。但是Hadoop,尤其是Mahout,激起了我的兴趣。为了使用它们,我准备深入Java

因此,从人们的经验来看,我需要多少Java才能有效地使用这些工具?从我所看到的来看,编程映射器/还原器并不需要那么多。但是对于Mahout,当我查看文档时,我根本不确定我在看什么


另外,通过Hadoop和Mahout从我的PHP应用程序中获取数据以进行Java处理有多难?我无法想象会有那么难,但我没有足够的经验来说明这一点。

使用Mahout和Hadoop从PHP获取数据到Java进行分析应该没有那么难

更简单的方法是在批处理模式下使用Mahout和Hadoop离线处理,并将数据产品存储在文件系统或数据库中。然后,PHP可以像从日志上掉下来一样轻松地读取这些数据产品


为了实时使用,Mahout的推荐部分支持各种web服务接口,使得从PHP访问非常容易。点击Mahout的模型评估部分需要更多的编程

Java初级水平就足够了。你可以随时根据需要深入挖掘。

我也做了同样的事情,多年来我一直在做与Java相关的事情。我所做的是:

  • 从简单的Hadoop流媒体示例开始
  • 尝试我自己对PHP流的分析
  • 开始用猪做实验
  • 开始尝试在Pig中使用PHP流媒体

  • 没有任何Java

    对于实时建议,您还可以在java servlet类中实例化mahout的一个实例,然后将其作为war导出到tomcat服务器上。

    Ted,您介意将文档中提到这些web服务接口的地方指给我看吗?我不确定到目前为止我自己是否遇到过这种情况。同时,谢谢你的回答!没有关系。我想我是在Taste文档下找到的。不过,对于像我这样的noob,您是否介意稍微扩展一下如何将PHP集成到实时应用程序中与Mahout一起工作?非常感谢。很抱歉回答得太慢了。。。但是,通过从PHP到Mahout的Taste组件的web服务调用,PHP很容易集成。另一种选择是使用Quercus从Java环境运行PHP,并直接调用ApacheMahout组件,这样就足以启动并运行一个(PHP友好的)Web服务,只需配置一个评级文本文件。它几乎没有触及可能的表面,但却是一个很好的开始方式。