Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 使用Apache超集或Redash的Spark Thrift Server中的NullPointerException_Apache Spark_Apache Superset_Pyhive_Spark Thriftserver - Fatal编程技术网

Apache spark 使用Apache超集或Redash的Spark Thrift Server中的NullPointerException

Apache spark 使用Apache超集或Redash的Spark Thrift Server中的NullPointerException,apache-spark,apache-superset,pyhive,spark-thriftserver,Apache Spark,Apache Superset,Pyhive,Spark Thriftserver,在将诸如Redash或Superset之类的BI工具连接到Spark Thriftserver(两种工具都使用PyHive)之后,我得到了一个NullPointerException。ApacheZeppelin可以很好地处理使用STS的查询,我永远无法重现那里的错误(Zeppelin使用org.Apache.hive.jdbc.HiveDriver) 这会将STS发送到只有重新启动才能将其恢复的状态。来自所有客户机的查询都将失败(齐柏林飞艇、beeline、Redash、Superset)。这

在将诸如Redash或Superset之类的BI工具连接到Spark Thriftserver(两种工具都使用PyHive)之后,我得到了一个NullPointerException。ApacheZeppelin可以很好地处理使用STS的查询,我永远无法重现那里的错误(Zeppelin使用org.Apache.hive.jdbc.HiveDriver)

这会将STS发送到只有重新启动才能将其恢复的状态。来自所有客户机的查询都将失败(齐柏林飞艇、beeline、Redash、Superset)。这似乎主要发生在模式自动获取时(这不太有效,DB名称获取正确,表名称错误)。在浏览PyHive代码时,我遇到了PyHive STS之间的一些不兼容(如和)。Redash/Superset和STS之间的连接工作正常,我可以进行查询,直到Thriftserver进入断开状态

我理解为什么模式刷新不起作用(也许可以解决这个问题),但我不理解为什么Thriftserver使用NullPointerException进入一个不可恢复、中断的状态

我的设置:

  • 库伯内特斯
  • 数据格式为Delta的Delta Lake
  • 蜂巢元存储
  • 启动Spark Thriftserver的Spark群集:
    start-Thriftserver.sh--执行器内核总数3--驱动程序内存3G--执行器内存1536M--hiveconf hive.server2.thrift.port 10000--hiveconf hive.server2.thrift.max.worker.threads 2000--hiveconf hive.server2.thrift.bind.host我的主机
    (我还尝试了
    spark.sql.thriftServer.incrementalCollect=false
    ,但没有任何影响。)
  • 连接到STS的Redash/Apache超集

我也有同样的问题。有趣的是,来自DBeaver的连接可以工作(driver org.spark project.hive:hivejdbc:RELEASE)。但当我尝试通过ODBC连接时,STS抛出NPE并进入不可恢复状态,我必须重新启动。
DB engine Error
hive error: ('Query error', 'Error running query: java.lang.NullPointerException')