Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/319.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在apache spark中使用seaborn_Python_Apache Spark_Pyspark_Seaborn_Scatter Matrix - Fatal编程技术网

Python 在apache spark中使用seaborn

Python 在apache spark中使用seaborn,python,apache-spark,pyspark,seaborn,scatter-matrix,Python,Apache Spark,Pyspark,Seaborn,Scatter Matrix,使用pandas和seaborn在一个有5000万个案例的csv数据框上制作一些散布矩阵,我注意到处理时间非常长,为了方便起见,我对部分数据制作了df.sample(),这减少了处理时间。考虑到ApacheSpark的潜力,我想问一下是否有可能应用它的速度来处理所有5000万个要创建的数据:scatter matrix,scatter plot,pairgrid等。从这方面的信息来看,我发现要做到这一点相当困难

使用pandas和seaborn在一个有5000万个案例的csv数据框上制作一些散布矩阵,我注意到处理时间非常长,为了方便起见,我对部分数据制作了
df.sample()
,这减少了处理时间。考虑到ApacheSpark的潜力,我想问一下是否有可能应用它的速度来处理所有5000万个要创建的数据:
scatter matrix
scatter plot
pairgrid
等。从这方面的信息来看,我发现要做到这一点相当困难