Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用python在HDFS中创建文件_Python_Hadoop_Streaming_Hdfs - Fatal编程技术网

使用python在HDFS中创建文件

使用python在HDFS中创建文件,python,hadoop,streaming,hdfs,Python,Hadoop,Streaming,Hdfs,我正在尝试使用python在HDFS中创建一个文件/目录。 明确地说,我正在运行一个Hadoop流作业,映射器是用Python编写的。这个映射程序实际上是在尝试用HDFS创建一个文件。 我读到有几个Python框架可以做到这一点,但我感兴趣的是Hadoop流。 那么,在Hadoop流媒体中有什么方法可以实现这一点吗?您可以在脚本python中运行命令HDFS import sys, subprocess def run_cmd(args_list): proc = subpro

我正在尝试使用python在HDFS中创建一个文件/目录。 明确地说,我正在运行一个Hadoop流作业,映射器是用Python编写的。这个映射程序实际上是在尝试用HDFS创建一个文件。 我读到有几个Python框架可以做到这一点,但我感兴趣的是Hadoop流。
那么,在Hadoop流媒体中有什么方法可以实现这一点吗?

您可以在脚本python中运行命令HDFS

import sys, subprocess

def run_cmd(args_list):
        proc = subprocess.Popen(args_list, stdout=subprocess.PIPE,stderr=subprocess.PIPE)
        (output, errors) = proc.communicate()
        if proc.returncode:
                raise RuntimeError('Error run_cmd')
        return (output, errors)

(out, errors)=run_cmd(['hdfs','dfs','-mkdir','%s' %apth_HDFS_to_create_folder])