除了使用Jython之外,在HiveUDF中使用Python最简单的方法是什么?

除了使用Jython之外,在HiveUDF中使用Python最简单的方法是什么?,python,hive,Python,Hive,最糟糕的情况是,我想我可以实现一个UDF,生成一个进程等。但我想知道是否有人已经这样做了。我应该改用Hive的流功能()。这允许使用任意脚本。您可以在hiveql中使用transform,这是一种有效的hadoop流式处理方法 配置单元中的cli类型 FILE ${env:HOME}/myscript.py; //you do not need this if your script is guaranteed to be installed on a cluster, this just ad

最糟糕的情况是,我想我可以实现一个UDF,生成一个进程等。但我想知道是否有人已经这样做了。

我应该改用Hive的流功能()。这允许使用任意脚本。

您可以在hiveql中使用transform,这是一种有效的hadoop流式处理方法

配置单元中的cli类型

FILE ${env:HOME}/myscript.py; //you do not need this if your script is guaranteed to be installed on a cluster, this just adds script to cache.

SELECT TRANSFORM(someColumn) USING 'myscript.py' AS convert FROM mytable;