Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark Spark 3.0.1数据帧操作可以工作,但Spark SQL不能_Apache Spark_Apache Spark Sql - Fatal编程技术网

Apache spark Spark 3.0.1数据帧操作可以工作,但Spark SQL不能

Apache spark Spark 3.0.1数据帧操作可以工作,但Spark SQL不能,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,我构建了一个运行Hadoop(HDFS)和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而,我最近将Spark升级到了3.0.1,将Scala升级到了2.12,我没有使用Hadoop 当我运行数据帧操作时,它就像一个符咒;然而,当我尝试运行sparksql命令时,它们最终会出错。e、 g spark.sql(“来自mytable的SEELECT计数(*))。我使用的数据集非常小(几kb),但S

我构建了一个运行Hadoop(HDFS)和Spark的Raspberry Pi 6节点集群。我最初让Spark 2.4.3、Hadoop 3.2.1和Scala 2.11像一个魔咒一样工作。然而,我最近将Spark升级到了3.0.1,将Scala升级到了2.12,我没有使用Hadoop

当我运行数据帧操作时,它就像一个符咒;然而,当我尝试运行sparksql命令时,它们最终会出错。e、 g spark.sql(“来自mytable的SEELECT计数(*))。我使用的数据集非常小(几kb),但Spark SQL仍然出错。如果我使用DataFrameAPI语法进行操作,它的工作就像一个魔咒

我为一个这样的spark sql错误附加了stderror(指向Google Drive中文本文件的链接)。我们将非常感谢您的任何帮助


执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常,但SQL却不行。它们(几乎)是可以互换的。@JacekLaskowski,我把一个小脚本放在一起,展示我在说什么。您可以看到数据帧操作可以工作,但sql不能:在sql中,您可以进行计数(*),在数据帧api中,这是不同的
show()
是否扫描data@RaphaelRoth,谢谢你接电话。我继续添加了一个df.count(),同样的错误也发生了。见第10单元:执行人和“dietpi5:32929”之间似乎存在网络问题。我很惊讶地听到DataFrameAPI工作正常,但SQL却不行。它们(几乎)是可以互换的。@JacekLaskowski,我把一个小脚本放在一起,展示我在说什么。您可以看到数据帧操作可以工作,但sql不能:在sql中,您可以进行计数(*),在数据帧api中,这是不同的
show()
是否扫描data@RaphaelRoth,谢谢你接电话。我继续添加了一个df.count(),同样的错误也发生了。见第10单元: