Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 使用Pyspark与python解释器、pandas和Ipython笔记本集成sparksql_Python 3.x_Pandas_Matplotlib_Pyspark_Apache Spark Sql - Fatal编程技术网

Python 3.x 使用Pyspark与python解释器、pandas和Ipython笔记本集成sparksql

Python 3.x 使用Pyspark与python解释器、pandas和Ipython笔记本集成sparksql,python-3.x,pandas,matplotlib,pyspark,apache-spark-sql,Python 3.x,Pandas,Matplotlib,Pyspark,Apache Spark Sql,我想知道哪种解释器适合Python使用Numpy、pandas和matplotlib等具有集成Ipython笔记本功能的特性 我还想将其与ApacheSpark集成。可能吗 我的目标是需要从不同的源加载不同的表,如Oracle、MS SQL和HDFS文件,并需要使用Pyspark、SparkSQL对它们进行转换。然后我想使用pandas/matplolib进行操作和可视化。查看hortonworks沙箱。这是一个安装并配置了hadoop及其所有组件(如spark ad hdfs)的虚拟机。除此之

我想知道哪种解释器适合Python使用Numpy、pandas和matplotlib等具有集成Ipython笔记本功能的特性

我还想将其与ApacheSpark集成。可能吗


我的目标是需要从不同的源加载不同的表,如Oracle、MS SQL和HDFS文件,并需要使用Pyspark、SparkSQL对它们进行转换。然后我想使用pandas/matplolib进行操作和可视化。

查看hortonworks沙箱。这是一个安装并配置了hadoop及其所有组件(如spark ad hdfs)的虚拟机。除此之外,还有一本叫做齐柏林飞艇笔记本的笔记本,允许您用python或其他语言编写脚本。 您还可以免费安装python库并通过笔记本访问它们,尽管我很高兴它自带了自己的数据可视化

请注意,spark数据帧类型与pandas数据帧类型不兼容。您必须将数据转换为一个简单的矩阵,然后重新积分为spark或pandas类型