Python 3.x pyspark:当我通过发送--py file参数将文件用作模块时,没有模块错误

Python 3.x pyspark:当我通过发送--py file参数将文件用作模块时,没有模块错误,python-3.x,pyspark,Python 3.x,Pyspark,我有两个名为dependencies的文件夹,src其中dependencies文件夹有两个名为common.py,load.py的python文件,src有driver.py文件 现在,为了使common.py、load.py文件对EMR集群中的所有节点都可用,我将dependencies文件夹压缩为pack.zip并作为 spark-submit --py-files pack.zip driver.py 注意:在dependencies文件夹中添加了init.py 这里的问题是我在dri

我有两个名为dependencies的文件夹,src其中dependencies文件夹有两个名为
common.py
load.py
的python文件,src有
driver.py
文件

现在,为了使common.py、load.py文件对EMR集群中的所有节点都可用,我将dependencies文件夹压缩为pack.zip并作为

spark-submit --py-files pack.zip driver.py
注意:在dependencies文件夹中添加了init.py

这里的问题是我在driver.py中使用了common.py/load.py方法

from dependencies.common import some_function

from dependencies.load import some_function
我收到公用/加载的无模块错误

我希望在没有任何错误的情况下获得预期的输出,模块公共和负载必须加载到驱动程序文件中并利用它们


提前感谢。

它是
\uuuu init\uuuuuuuy.py
并且应该在python模块中的每个文件夹中。它在我想要使用模块的所有文件夹中都可用,但仍然是相同的错误。我尝试了所有可能的方法。发布压缩文件的结构(目录树)。是否在群集模式下运行它?您可能还需要使用addPyfile方法将其添加到driver.py中。请参见下文,在aws EMR中以群集模式运行,现在给出退出代码13错误。