Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 如何在分区文件上创建数据帧_Python 3.x_Apache Spark_Pyspark_Apache Spark Sql - Fatal编程技术网

Python 3.x 如何在分区文件上创建数据帧

Python 3.x 如何在分区文件上创建数据帧,python-3.x,apache-spark,pyspark,apache-spark-sql,Python 3.x,Apache Spark,Pyspark,Apache Spark Sql,我有1000多个拼花地板文件在一个文件夹中,这是一个分区文件夹。 现在我们需要使用这些文件对其执行一些转换。 我需要创建数据帧使用这些拼花文件。有什么建议吗 请尝试以下代码: DF = sqlContext.read.parquet(r"<folderpath>/*") DF=sqlContext.read.parquet(r”/*”) *表示指定文件夹下存在的所有文件 DF将是一个数据框,其中包含中所有拼花地板文件的数据。然后可以在DF上执行转换

我有1000多个拼花地板文件在一个文件夹中,这是一个分区文件夹。 现在我们需要使用这些文件对其执行一些转换。 我需要创建数据帧使用这些拼花文件。有什么建议吗

请尝试以下代码:

DF = sqlContext.read.parquet(r"<folderpath>/*") 
DF=sqlContext.read.parquet(r”/*”)
*
表示指定文件夹下存在的所有文件

DF
将是一个数据框,其中包含
中所有拼花地板文件的数据。然后可以在
DF
上执行转换