Apache spark Spark 3.0.1数据帧操作可以工作，但Spark SQL不能_Apache Spark_Apache Spark Sql

Apache spark Spark 3.0.1数据帧操作可以工作，但Spark SQL不能

apache-spark

Apache spark Spark 3.0.1数据帧操作可以工作，但Spark SQL不能,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,我构建了一个运行Hadoop（HDFS）和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而，我最近将Spark升级到了3.0.1，将Scala升级到了2.12，我没有使用Hadoop 当我运行数据帧操作时，它就像一个符咒；然而，当我尝试运行sparksql命令时，它们最终会出错。e、 g spark.sql（“来自mytable的SEELECT计数（*））。我使用的数据集非常小（几kb），但S

我构建了一个运行Hadoop（HDFS）和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而，我最近将Spark升级到了3.0.1，将Scala升级到了2.12，我没有使用Hadoop

当我运行数据帧操作时，它就像一个符咒；然而，当我尝试运行sparksql命令时，它们最终会出错。e、 g spark.sql（“来自mytable的SEELECT计数（*））。我使用的数据集非常小（几kb），但Spark SQL仍然出错。如果我使用DataFrameAPI语法进行操作，它的工作就像一个魔咒

我为一个这样的spark sql错误附加了stderror（指向Google Drive中文本文件的链接）。我们将非常感谢您的任何帮助

执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常，但SQL却不行。它们（几乎）是可以互换的。@JacekLaskowski，我把一个小脚本放在一起，展示我在说什么。您可以看到数据帧操作可以工作，但sql不能：在sql中，您可以进行计数（*），在数据帧api中，这是不同的

show（）

是否扫描data@RaphaelRoth，谢谢你接电话。我继续添加了一个df.count（），同样的错误也发生了。见第10单元：执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常，但SQL却不行。它们（几乎）是可以互换的。@JacekLaskowski，我把一个小脚本放在一起，展示我在说什么。您可以看到数据帧操作可以工作，但sql不能：在sql中，您可以进行计数（*），在数据帧api中，这是不同的

show（）

是否扫描data@RaphaelRoth，谢谢你接电话。我继续添加了一个df.count（），同样的错误也发生了。见第10单元：