Hadoop 如何将归档或项目Python添加到配置单元

Hadoop 如何将归档或项目Python添加到配置单元,hadoop,hive,transform,archive,hiveql,Hadoop,Hive,Transform,Archive,Hiveql,如何将存档添加到配置单元例如: 配置单元>添加归档路径\u project/my\u project.tar.gz 并执行此查询: 使用my_yable limit 1中的“python path_project/script.py”选择transform(字段_1,字段_2) 我试过了,但没有成功 谢谢我想将此复制到,但由于答案不被接受,因此不允许复制 ADD ARCHIVE path_project/my_project.tar.gz; 当您添加归档文件path\u project/my\

如何将存档添加到配置单元例如:

配置单元>添加归档路径\u project/my\u project.tar.gz

并执行此查询:

使用my_yable limit 1中的“python path_project/script.py”选择transform(字段_1,字段_2)

我试过了,但没有成功


谢谢

我想将此复制到,但由于答案不被接受,因此不允许复制

ADD ARCHIVE path_project/my_project.tar.gz;
当您添加归档文件
path\u project/my\u project.tar.gz
时,归档文件将被提取到
my\u project.tar.gz/
,因此您需要将脚本作为

SELECT transform(field_1,field_2)
USING 'python my_project.tar.gz/script.py'
FROM my_yable
LIMIT 1;
如果你看一下文档中的例子,它暗示了约定。顺便说一句:支持的归档格式是

存档(zip、tar和tgz/tar.gz文件)在工作节点上取消存档