来自HBase的Hadoop mapreduce流媒体

来自HBase的Hadoop mapreduce流媒体,hadoop,mapreduce,hbase,Hadoop,Mapreduce,Hbase,我正在构建一个Hadoop(0.20.1)mapreduce作业,它使用HBase(0.20.1)作为数据源和数据接收器。我想用Python编写这个作业,它要求我使用hadoop-0.20.1-streaming.jar在Python脚本之间传输数据。如果数据源/接收器是HDFS文件,则此操作可以正常工作 Hadoop是否支持从HBase到mapreduce的流式传输 这似乎是我想要的,但它不是Hadoop发行版的一部分。欢迎提出任何其他建议或意见 对于我的问题,您有什么建议吗?您是否看过Hba

我正在构建一个Hadoop(0.20.1)mapreduce作业,它使用HBase(0.20.1)作为数据源和数据接收器。我想用Python编写这个作业,它要求我使用hadoop-0.20.1-streaming.jar在Python脚本之间传输数据。如果数据源/接收器是HDFS文件,则此操作可以正常工作


Hadoop是否支持从HBase到mapreduce的流式传输

这似乎是我想要的,但它不是Hadoop发行版的一部分。欢迎提出任何其他建议或意见


对于我的问题,您有什么建议吗?您是否看过Hbase+Kafka+Spark流媒体集成?