Hive 配置单元-如何存储配置单元查询结果以供以后参考？_Hive_Putty_Hiveql_Hadoop2

Hive 配置单元-如何存储配置单元查询结果以供以后参考？

hive

Hive 配置单元-如何存储配置单元查询结果以供以后参考？,hive,putty,hiveql,hadoop2,Hive,Putty,Hiveql,Hadoop2,我通常通过putty连接到网关节点，并在那里运行配置单元查询有时，这些查询会一起运行数小时。至少有几次putty断开连接，查询的执行也会中止有没有办法以某种方式存储配置单元查询结果，以便我以后可以检查它们我不想创建另一个表来存储结果。您可以存储结果 INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table 您可以存储结果 INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM

我通常通过putty连接到网关节点，并在那里运行配置单元查询

有时，这些查询会一起运行数小时。至少有几次putty断开连接，查询的执行也会中止

有没有办法以某种方式存储配置单元查询结果，以便我以后可以检查它们

我不想创建另一个表来存储结果。

您可以存储结果

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table

您可以存储结果

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table

那么，基本上，您希望在后台运行查询并将结果转储到文本文件中？有像

nohup

和

batch

这样的实用程序已经存在至少40年了。。。例如，

nohup-hive-e“从wtf中选择计数（*）2>$HOME/query.log 1>$HOME/query.out&

@Samson Scharfrichter:对不起，我犯了一个错误，我更新了问题。putty断开连接时查询中止。你的答案很有用！谢谢。如果您的群集上运行着HiveServer2，如果没有防火墙阻止您的PC连接到端口10000上的HS2计算机，并且如果您不使用Hive CLI变量-->install DBVisualizer或类似的实用程序，您也可以完全避免PuTTY步骤，请安装Hive JDBC驱动程序（最好是Cloudera驱动程序，它是免费下载的；Apache驱动程序需要大量额外的JAR，与较旧的HiveServer2版本相比没有兼容性保证，并且配置Kerberos身份验证是一场噩梦），并直接从您的PC上运行查询。@Samson Scharfrichter:谢谢。我使用了色调，然后配置为使用HS2。出于几个原因，我不太喜欢色调（用户界面比较混乱，旧版本常常在非Ascii字符上崩溃，python代码在服务器端吐出大量笨拙的日志）如果你对色调很满意，好吧。但是如果你想花很多时间在这上面，你可能想试试“真的”数据库工具。因此，基本上，您希望在后台运行查询并将结果转储到文本文件中？有一些实用程序，如

nohup

和

batch

，已经存在至少40年了……例如

nohup hive-e“从wtf中选择计数（*））2>$HOME/query.log 1>$HOME/query.out&

@Samson Scharfrichter:很抱歉我犯了一个错误，我更新了这个问题。query会在putty断开连接时中止。不过，您的答案很有用！谢谢。如果您的群集上运行HiveServer2，如果没有防火墙阻止您的PC连接到HS2 mac，您也可以完全避免putty步骤在端口10000上安装hine，如果未使用配置单元CLI变量-->安装DBVisualizer或类似实用程序，请安装配置单元JDBC驱动程序（最好是Cloudera驱动程序，它是免费下载的；Apache驱动程序需要大量额外的JAR，与较旧的HiveServer2版本相比没有兼容性保证，并且配置Kerberos身份验证是一场噩梦），并直接从您的PC上运行查询。@Samson Scharfrichter:谢谢。我使用了色调，然后配置为使用HS2。出于几个原因，我不太喜欢色调（用户界面比较混乱，旧版本常常在非Ascii字符上崩溃，python代码在服务器端吐出大量笨拙的日志）。如果您对色调很满意，很好。但是如果您希望在这方面花费大量时间，您可能希望尝试“真正的”数据库工具。如果putty断开连接，查询是否会继续运行？谢谢。如果putty断开连接，查询是否会继续运行？谢谢。