Pyspark Pypark和jupyter笔记本电脑不';不要在windows 10上工作

Pyspark Pypark和jupyter笔记本电脑不';不要在windows 10上工作,pyspark,windows-10,jupyter-notebook,jupyter,Pyspark,Windows 10,Jupyter Notebook,Jupyter,我按照此指南逐步在我的PC windows 10上安装pyspark和jupyter笔记本: 我完全按照指南中的说明设置了所有内容,但是当我运行命令“pyspark”时,我收到以下错误消息: 执行Jupyter命令“notebook”时出错:[Errno“Jupyter notebook”未找到]2 我试图寻找一个解决方案,但没有找到任何与我类似的案例,最相似的是关于linux上的pyspark 如果有人能解释我需要改变什么才能让它工作,我将非常感激! 如果有人还有其他关于如何在windows

我按照此指南逐步在我的PC windows 10上安装pyspark和jupyter笔记本:

我完全按照指南中的说明设置了所有内容,但是当我运行命令“pyspark”时,我收到以下错误消息:

执行Jupyter命令“notebook”时出错:[Errno“Jupyter notebook”未找到]2

我试图寻找一个解决方案,但没有找到任何与我类似的案例,最相似的是关于linux上的pyspark

如果有人能解释我需要改变什么才能让它工作,我将非常感激!
如果有人还有其他关于如何在windows上使用pyspark的指南,那也太好了,我还是个新手。

在windows 10上安装pyspark 带水蟒导航器的JUPYTER-NOTEBOOK

第一步 下载软件包

1) spark-2.2.0-bin-hadoop2.7.tgz

2) JavaJDK8版本

3) 巨蟒v 5.2

4) scala-2.12.6.msi

5) hadoop v2.7.1

步骤2 在C://驱动器中创建SPARK文件夹,并将所有内容放入其中

注意:在安装SCALA的过程中,在SPARK文件夹中给出SCALA的路径

步骤3 现在设置新的WINDOWS环境变量

  • HADOOP\u HOME=C:\spark\HADOOP

  • JAVA\u HOME=C:\Program Files\JAVA\jdk1.8.0\u 151

  • SCALA\u HOME=C:\spark\SCALA\bin

  • SPARK\u HOME=C:\SPARK\SPARK\bin

  • PYSPARK\u PYTHON=C:\Users\user\Anaconda3\PYTHON.exe

  • PYSPARK\u DRIVER\u PYTHON=C:\Users\user\Anaconda3\Scripts\jupyter.exe

  • PYSPARK\u DRIVER\u PYTHON\u OPTS=notebook

  • 现在选择火花的路径

    单击编辑并添加新内容

    将“C:\spark\spark\bin”添加到变量“Path”窗口

  • 步骤4
    • 创建一个文件夹,用于存储Jupyter笔记本输出和文件
    • 之后,打开Anaconda命令提示符和cd文件夹名称
    • 然后输入Pyspark
    就是这样,您的浏览器将弹出Juypter localhost

    步骤5 检查pyspark是否工作

    键入简单代码并运行它

    from pyspark.sql import Row
    a = Row(name = 'Vinay' , age=22 , height=165)
    print("a: ",a)
    

    在Windows 10上安装PYSPARK 带水蟒导航器的JUPYTER-NOTEBOOK

    第一步 下载软件包

    1) spark-2.2.0-bin-hadoop2.7.tgz

    2) JavaJDK8版本

    3) 巨蟒v 5.2

    4) scala-2.12.6.msi

    5) hadoop v2.7.1

    步骤2 在C://驱动器中创建SPARK文件夹,并将所有内容放入其中

    注意:在安装SCALA的过程中,在SPARK文件夹中给出SCALA的路径

    步骤3 现在设置新的WINDOWS环境变量

  • HADOOP\u HOME=C:\spark\HADOOP

  • JAVA\u HOME=C:\Program Files\JAVA\jdk1.8.0\u 151

  • SCALA\u HOME=C:\spark\SCALA\bin

  • SPARK\u HOME=C:\SPARK\SPARK\bin

  • PYSPARK\u PYTHON=C:\Users\user\Anaconda3\PYTHON.exe

  • PYSPARK\u DRIVER\u PYTHON=C:\Users\user\Anaconda3\Scripts\jupyter.exe

  • PYSPARK\u DRIVER\u PYTHON\u OPTS=notebook

  • 现在选择火花的路径

    单击编辑并添加新内容

    将“C:\spark\spark\bin”添加到变量“Path”窗口

  • 步骤4
    • 创建一个文件夹,用于存储Jupyter笔记本输出和文件
    • 之后,打开Anaconda命令提示符和cd文件夹名称
    • 然后输入Pyspark
    就是这样,您的浏览器将弹出Juypter localhost

    步骤5 检查pyspark是否工作

    键入简单代码并运行它

    from pyspark.sql import Row
    a = Row(name = 'Vinay' , age=22 , height=165)
    print("a: ",a)
    

    运行
    pip list
    命令-你能在已安装的软件包列表中看到
    jupyter
    吗?运行
    pip list
    命令-你能在已安装的软件包列表中看到
    jupyter
    吗?我想第1步)可以通过
    pip install pyspark
    安装