Spark submit部署在群集模式下导入numpy作为np导入错误:没有名为numpy的模块
这是我收到的错误消息Spark submit部署在群集模式下导入numpy作为np导入错误:没有名为numpy的模块,numpy,apache-spark,pyspark,Numpy,Apache Spark,Pyspark,这是我收到的错误消息 Traceback (most recent call last): File "logistic_regression.py", line 29, in <module> import numpy as np ImportError: No module named numpy 回溯(最近一次呼叫最后一次): 文件“logistic_regression.py”,第29行,在 将numpy作为np导入 ImportError:没有名为numpy的
Traceback (most recent call last):
File "logistic_regression.py", line 29, in <module>
import numpy as np
ImportError: No module named numpy
回溯(最近一次呼叫最后一次):
文件“logistic_regression.py”,第29行,在
将numpy作为np导入
ImportError:没有名为numpy的模块
我已经在每个节点上安装了Anaconda,并将PYSPARK_PYTHON设置为指向Anaconda PYTHON目录。主节点与其他工作节点具有相同的设置,有什么问题吗?您在每个节点上都设置了PYSPARK_PYTHON吗?是的,我已经将其设置为Anaconda/bin/python27您可以确认这是从工作人员那里看到的路径吗?我如何做到?首先,sys.executable您在每个节点上都设置了PYSPARK_PYTHON吗?是的,我已经将其设置为Anaconda/bin/python27您可以确认这是正确的路径吗从工人那里看到的?我该怎么做?首先是sys.exe