Amazon ec2 使用Amazon弹性MapReduce的嵌入式Pig脚本

Amazon ec2 使用Amazon弹性MapReduce的嵌入式Pig脚本,amazon-ec2,apache-pig,Amazon Ec2,Apache Pig,我正在尝试运行嵌入python的Pig脚本。我做完了 在我自己的机器上运行像pig-x这样的脚本,这是没有问题的 本地piglunner.py 但当我把它转移到亚马逊的EC2上时,我发现了一个令人惊讶的错误: File "pigRunner.py", line 3 in <module> from org.apache.pig.scripting import * ImportError: No module named pig [1]+ Exit 6 pig -x mapre

我正在尝试运行嵌入python的Pig脚本。我做完了 在我自己的机器上运行像pig-x这样的脚本,这是没有问题的 本地piglunner.py 但当我把它转移到亚马逊的EC2上时,我发现了一个令人惊讶的错误:

File "pigRunner.py", line 3 in <module>
  from org.apache.pig.scripting import *
ImportError: No module named pig

[1]+ Exit 6 pig -x mapreduce pigRunner.py
文件“piglunner.py”,第3行
从org.apache.pig.scripting导入*
ImportError:没有名为pig的模块
[1] +出口6清管器-x mapreduce pigRunner.py
还有人在Amazon上运行Python脚本时遇到问题吗?是 有什么特别的事情我应该做,以使他们的进程


感谢您提供的帮助。

我遇到了同样的问题,发现这是一个路径问题。我运行的是AMI版本“2.4.2(Hadoop 1.0.3)-最新版本”

在我的嵌入式pig python文件中,在从pig导入任何内容之前,我必须将以下位置添加到python路径中:

#!/usr/bin/python
sys.path.append('/home/hadoop/.versions/pig-0.11.1.1/lib/pig/pig-0.11.1.1-amzn.jar/Lib')
from org.apache.pig.scripting import *

然后jython解释器能够找到所有必要的清管器模块。

此问题可能有助于您进一步了解: