Hadoop 如何将现有的MapReduce应用程序转换为Crunch?

Hadoop 如何将现有的MapReduce应用程序转换为Crunch?,hadoop,mapreduce,apache-crunch,Hadoop,Mapreduce,Apache Crunch,我已经实现了几个(大约十几个)MapReduce任务,每个任务都是由一个简单的bash脚本执行的工作流的一部分。出于各种原因,我想将工作流转移到ApacheCrunch 但是,我不清楚如何在不重新实现的情况下将MapReduce任务作为Crunch函数运行。有没有一种简单的方法可以将Map和Reduce实现用作Crunch函数?我还想维护工具实现,这样MapReduce任务既可以独立运行,也可以作为Crunch工作流的一部分运行;有没有办法做到这一点 感谢您提供的见解。对于任何可能偶然发现这一点

我已经实现了几个(大约十几个)MapReduce任务,每个任务都是由一个简单的bash脚本执行的工作流的一部分。出于各种原因,我想将工作流转移到ApacheCrunch

但是,我不清楚如何在不重新实现的情况下将MapReduce任务作为Crunch函数运行。有没有一种简单的方法可以将Map和Reduce实现用作Crunch函数?我还想维护工具实现,这样MapReduce任务既可以独立运行,也可以作为Crunch工作流的一部分运行;有没有办法做到这一点


感谢您提供的见解。

对于任何可能偶然发现这一点的人,Crunch libs中有一个记录最少的API。然而,这相当简单

请看这里: