Python 在Apache Pig上使用Numpy和SciPy
我想用ApachePig编写UDF。我将使用Python UDF。 我的问题是我有大量的数据要分析,需要像NumPy和SciPy这样的软件包。买这个,他们没有Jython支持,我不能和猪一起使用 我们有替代项吗?您可以通过导入scipy的(C)Python脚本进行流式处理。Python 在Apache Pig上使用Numpy和SciPy,python,numpy,scipy,apache-pig,Python,Numpy,Scipy,Apache Pig,我想用ApachePig编写UDF。我将使用Python UDF。 我的问题是我有大量的数据要分析,需要像NumPy和SciPy这样的软件包。买这个,他们没有Jython支持,我不能和猪一起使用 我们有替代项吗?您可以通过导入scipy的(C)Python脚本进行流式处理。 例如,我正在使用import scipy.cluster.hierarchy,使用它对行李中的数据进行聚类,谢谢。那么,您是否将数据转储出来并使用hadoop流媒体来实现这一点?
例如,我正在使用import scipy.cluster.hierarchy,使用它对行李中的数据进行聚类,谢谢。那么,您是否将数据转储出来并使用hadoop流媒体来实现这一点?