Pyspark Pypark和jupyter笔记本电脑不'；不要在windows 10上工作_Pyspark_Windows 10_Jupyter Notebook_Jupyter

Pyspark Pypark和jupyter笔记本电脑不'；不要在windows 10上工作

pyspark windows-10 jupyter-notebook

Pyspark Pypark和jupyter笔记本电脑不'；不要在windows 10上工作,pyspark,windows-10,jupyter-notebook,jupyter,Pyspark,Windows 10,Jupyter Notebook,Jupyter,我按照此指南逐步在我的PC windows 10上安装pyspark和jupyter笔记本：我完全按照指南中的说明设置了所有内容，但是当我运行命令“pyspark”时，我收到以下错误消息：执行Jupyter命令“notebook”时出错：[Errno“Jupyter notebook”未找到]2 我试图寻找一个解决方案，但没有找到任何与我类似的案例，最相似的是关于linux上的pyspark 如果有人能解释我需要改变什么才能让它工作，我将非常感激！如果有人还有其他关于如何在windows

我按照此指南逐步在我的PC windows 10上安装pyspark和jupyter笔记本：

我完全按照指南中的说明设置了所有内容，但是当我运行命令“pyspark”时，我收到以下错误消息：

执行Jupyter命令“notebook”时出错：[Errno“Jupyter notebook”未找到]2

我试图寻找一个解决方案，但没有找到任何与我类似的案例，最相似的是关于linux上的pyspark

如果有人能解释我需要改变什么才能让它工作，我将非常感激！

如果有人还有其他关于如何在windows上使用pyspark的指南，那也太好了，我还是个新手。

在windows 10上安装pyspark 带水蟒导航器的JUPYTER-NOTEBOOK

第一步 下载软件包

1） spark-2.2.0-bin-hadoop2.7.tgz

2） JavaJDK8版本

3）巨蟒v 5.2

4） scala-2.12.6.msi

5） hadoop v2.7.1

步骤2 在C://驱动器中创建SPARK文件夹，并将所有内容放入其中

注意：在安装SCALA的过程中，在SPARK文件夹中给出SCALA的路径

步骤3 现在设置新的WINDOWS环境变量

HADOOP\u HOME=C:\spark\HADOOP

JAVA\u HOME=C:\Program Files\JAVA\jdk1.8.0\u 151

SCALA\u HOME=C:\spark\SCALA\bin

SPARK\u HOME=C:\SPARK\SPARK\bin

PYSPARK\u PYTHON=C:\Users\user\Anaconda3\PYTHON.exe

PYSPARK\u DRIVER\u PYTHON=C:\Users\user\Anaconda3\Scripts\jupyter.exe

PYSPARK\u DRIVER\u PYTHON\u OPTS=notebook

现在选择火花的路径：

单击编辑并添加新内容

将“C:\spark\spark\bin”添加到变量“Path”窗口

步骤4

创建一个文件夹，用于存储Jupyter笔记本输出和文件
之后，打开Anaconda命令提示符和cd文件夹名称

然后输入Pyspark

就是这样，您的浏览器将弹出Juypter localhost
步骤5 检查pyspark是否工作
键入简单代码并运行它

from pyspark.sql import Row a = Row(name = 'Vinay' , age=22 , height=165) print("a: ",a)

在Windows 10上安装PYSPARK 带水蟒导航器的JUPYTER-NOTEBOOK
第一步 下载软件包
1） spark-2.2.0-bin-hadoop2.7.tgz
2） JavaJDK8版本
3）巨蟒v 5.2
4） scala-2.12.6.msi
5） hadoop v2.7.1
步骤2 在C://驱动器中创建SPARK文件夹，并将所有内容放入其中
注意：在安装SCALA的过程中，在SPARK文件夹中给出SCALA的路径
步骤3 现在设置新的WINDOWS环境变量

HADOOP\u HOME=C:\spark\HADOOP

JAVA\u HOME=C:\Program Files\JAVA\jdk1.8.0\u 151

SCALA\u HOME=C:\spark\SCALA\bin

SPARK\u HOME=C:\SPARK\SPARK\bin

PYSPARK\u PYTHON=C:\Users\user\Anaconda3\PYTHON.exe

PYSPARK\u DRIVER\u PYTHON=C:\Users\user\Anaconda3\Scripts\jupyter.exe

PYSPARK\u DRIVER\u PYTHON\u OPTS=notebook

现在选择火花的路径：
单击编辑并添加新内容
将“C:\spark\spark\bin”添加到变量“Path”窗口
步骤4

创建一个文件夹，用于存储Jupyter笔记本输出和文件

之后，打开Anaconda命令提示符和cd文件夹名称

然后输入Pyspark

就是这样，您的浏览器将弹出Juypter localhost
步骤5 检查pyspark是否工作
键入简单代码并运行它

from pyspark.sql import Row a = Row(name = 'Vinay' , age=22 , height=165) print("a: ",a)

运行
pip list
命令-你能在已安装的软件包列表中看到
jupyter
吗？运行
pip list
命令-你能在已安装的软件包列表中看到
jupyter
吗？我想第1步）可以通过
pip install pyspark
安装