什么类型的任务/应用程序可以使用Apache Hadoop(MapReduce函数)
我不明白什么类型的应用程序可以与Hadoop一起使用。是否每个任务都必须针对hadoop/mapreduce进行定制。例如,您可以将任何长时间运行的java处理与之关联吗?或者你是否特别需要为hadoop定制你的应用程序/任务。我想一个很好的例子是使用lucene和hadoop进行索引。hadoop实际上是一个用于进程拆分/合并的引擎。将任务拆分为相似的数据集[map],然后将相似的数据集合并为结果[reduce/merge]什么类型的任务/应用程序可以使用Apache Hadoop(MapReduce函数),hadoop,mapreduce,Hadoop,Mapreduce,我不明白什么类型的应用程序可以与Hadoop一起使用。是否每个任务都必须针对hadoop/mapreduce进行定制。例如,您可以将任何长时间运行的java处理与之关联吗?或者你是否特别需要为hadoop定制你的应用程序/任务。我想一个很好的例子是使用lucene和hadoop进行索引。hadoop实际上是一个用于进程拆分/合并的引擎。将任务拆分为相似的数据集[map],然后将相似的数据集合并为结果[reduce/merge] 这是制作并行应用程序的一种方法。映射和约简分布到集群中的不同节点。这
这是制作并行应用程序的一种方法。映射和约简分布到集群中的不同节点。这是一个非常严格的任务划分,进程之间可以传递什么样的数据[必须是可序列化的,并且与其他maps/reduces中的数据断开连接]MapReduce是一个处理模型;它准确地告诉您处理任务应该适合什么
因此,是的,您的任务必须进行转换以适应模型,才能正常工作。基本上,您必须能够将任务“拆分”为独立的任务 同意这一抽象描述,mapreduce还用于解析大型文件,例如Web服务器日志。这听起来像是一个需要描述而不是应用程序的问题。