Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/scala/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Pandas 斯卡拉和熊猫的火花_Pandas_Scala_Apache Spark_Pyspark - Fatal编程技术网

Pandas 斯卡拉和熊猫的火花

Pandas 斯卡拉和熊猫的火花,pandas,scala,apache-spark,pyspark,Pandas,Scala,Apache Spark,Pyspark,我想在Spark应用程序中使用Panda的转换,如Melt等。 我正在使用Scala作为Spark,我必须使用一些功能,比如Melt from Pandas,有可能吗 我看到熊猫和Pypark在笔记本电脑中携手共进。(如果没有更多细节,很难提供示例,所以这个答案只包括文档链接等。) 在Spark的最新版本中,支持所谓的Pandas UDF,即获取Pandas系列或dataframe作为参数并返回系列或参数,因此可以执行Pandas函数以获得结果。Pandas UDF比传统Python UDF快

我想在Spark应用程序中使用Panda的转换,如Melt等。 我正在使用Scala作为Spark,我必须使用一些功能,比如Melt from Pandas,有可能吗

我看到熊猫和Pypark在笔记本电脑中携手共进。

(如果没有更多细节,很难提供示例,所以这个答案只包括文档链接等。)

在Spark的最新版本中,支持所谓的Pandas UDF,即获取Pandas系列或dataframe作为参数并返回系列或参数,因此可以执行Pandas函数以获得结果。Pandas UDF比传统Python UDF快得多,因为优化了数据序列化等。有关更多详细信息,请参阅和


另一种选择是使用Spark的库,该库正在重新实现Pandas API,但正在Spark上执行。有一个问题,但一定要阅读文档,了解行为上可能存在的差异。

可能存在重复,但没有合适的解决方案:我想这里是您需要的答案