如何在HDFS hadoop上存储和处理视频数据

如何在HDFS hadoop上存储和处理视频数据,hadoop,mapreduce,hadoop-plugins,Hadoop,Mapreduce,Hadoop Plugins,我有一个视频文件。我已经用Xuggler将这个视频转换成一组图像帧。现在我必须读取每一帧图像,并且需要做一些处理。假设我们有2000张这样的图片(我使用的是Xuggler——它将视频转换成图像,然后再将图像转换成视频)。现在,在第一幅图中,我必须在给定的坐标上画一个矩形。一旦所有的图像处理完成,所有的图像就会通过Xuggler工具转换成视频 因为视频文件非常大,比如5TB甚至更多。我想在Hadoop mapreduce上完成所有图像处理工作。我在Hadoop中找到了一个专门用于图像处理的API

我有一个视频文件。我已经用Xuggler将这个视频转换成一组图像帧。现在我必须读取每一帧图像,并且需要做一些处理。假设我们有2000张这样的图片(我使用的是Xuggler——它将视频转换成图像,然后再将图像转换成视频)。现在,在第一幅图中,我必须在给定的坐标上画一个矩形。一旦所有的图像处理完成,所有的图像就会通过Xuggler工具转换成视频

因为视频文件非常大,比如5TB甚至更多。我想在Hadoop mapreduce上完成所有图像处理工作。我在Hadoop中找到了一个专门用于图像处理的API HIPI

但是,HIPI不支持添加元数据信息。我需要一些与每个图像相关联的元数据信息,以便在Mapper中我可以计算出图像ID,然后根据给定的参考文件处理该图像ID 注:我有一个参考文件,其中包含图像编号、图像位置坐标等信息。所以在MapTask中,当我得到任何特定的图像,比如10号图像时,我会做一些图像处理,比如绘制给定坐标的形状等

如果我使用HIPI,映射任务将ImageHeader作为键,FloatImage作为值。在ImageHeader中,我没有任何信息(甚至没有文件名)。因此,我无法将hdfs分发的文件与我拥有的参考数据进行比较

我们还有其他更好的方法吗