Apache spark Spark 3.0.1数据帧操作可以工作,但Spark SQL不能
我构建了一个运行Hadoop(HDFS)和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而,我最近将Spark升级到了3.0.1,将Scala升级到了2.12,我没有使用Hadoop 当我运行数据帧操作时,它就像一个符咒;然而,当我尝试运行sparksql命令时,它们最终会出错。e、 g spark.sql(“来自mytable的SEELECT计数(*))。我使用的数据集非常小(几kb),但Spark SQL仍然出错。如果我使用DataFrameAPI语法进行操作,它的工作就像一个魔咒 我为一个这样的spark sql错误附加了stderror(指向Google Drive中文本文件的链接)。我们将非常感谢您的任何帮助Apache spark Spark 3.0.1数据帧操作可以工作,但Spark SQL不能,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,我构建了一个运行Hadoop(HDFS)和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而,我最近将Spark升级到了3.0.1,将Scala升级到了2.12,我没有使用Hadoop 当我运行数据帧操作时,它就像一个符咒;然而,当我尝试运行sparksql命令时,它们最终会出错。e、 g spark.sql(“来自mytable的SEELECT计数(*))。我使用的数据集非常小(几kb),但S
执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常,但SQL却不行。它们(几乎)是可以互换的。@JacekLaskowski,我把一个小脚本放在一起,展示我在说什么。您可以看到数据帧操作可以工作,但sql不能:在sql中,您可以进行计数(*),在数据帧api中,这是不同的
show()
是否扫描data@RaphaelRoth,谢谢你接电话。我继续添加了一个df.count(),同样的错误也发生了。见第10单元:执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常,但SQL却不行。它们(几乎)是可以互换的。@JacekLaskowski,我把一个小脚本放在一起,展示我在说什么。您可以看到数据帧操作可以工作,但sql不能:在sql中,您可以进行计数(*),在数据帧api中,这是不同的show()
是否扫描data@RaphaelRoth,谢谢你接电话。我继续添加了一个df.count(),同样的错误也发生了。见第10单元: