Python Hadoop流媒体-模块依赖性
hadoop流媒体中是否有任何标准方法来处理类似于DistributedCache(在java MR中)的依赖关系Python Hadoop流媒体-模块依赖性,python,hadoop,hadoop-streaming,Python,Hadoop,Hadoop Streaming,hadoop流媒体中是否有任何标准方法来处理类似于DistributedCache(在java MR中)的依赖关系 例如,假设我有一个python模块用于所有映射任务。我怎样才能做到呢 可以使用-file参数指定python模块: 看 如果有依赖模块等,可以指定多个文件参数
例如,假设我有一个python模块用于所有映射任务。我怎样才能做到呢 可以使用-file参数指定python模块: 看 如果有依赖模块等,可以指定多个文件参数